10 通りの GPT

による支援

OpenAI は、オンラインチャットボットを強化するテクノロジーを注目すべき方法でアップグレードしました。それはより正確ですが、それでも物事を捏造します。

ケイド・メッツ、キース・コリンズ著

Cade Metz 氏は専門家に GPT-4 を使用するよう依頼し、Keith Collins 氏は人工知能が生成した答えを視覚化しました。

4 か月前にテクノロジー業界を魅了した AI チャットボットを強化するテクノロジーの新バージョンは、前バージョンよりも改良されました。さまざまなテーマの専門家であり、その医学的アドバイスで医師を驚かせることさえあります。イメージを説明することができ、ほとんど面白いジョークを言うことに近いです。

しかし、長い間噂されてきた新しい人工知能システムである GPT-4 には依然としていくつかの癖があり、チャットボットである ChatGPT が導入されたときに研究者を困惑させたのと同じ常習的な間違いをいくつか犯しています。

そして、このシステムは受験者としては非常に優れているが、サンフランシスコの新興企業 OpenAI が開発したこのシステムは、人間の知能に匹敵する段階には至っていない。 GPT-4 の簡単なガイドは次のとおりです。

AI の専門家であり、ベンチャーキャピタル会社 Page One Ventures のパートナーである Chris Nicholson 氏が、最近の午後 GPT-4 を使用したとき、彼はボットに、自分は英語を話し、スペイン語の知識はないと伝えました。

彼は基本を教えることができるシラバスを要求しました。そして、ボットは詳細でよく整理されたシラバスを提供しました。スペイン語の単語を学習して記憶するための幅広いテクニックも提供しました (ただし、その提案のすべてが的を射ているわけではありません)。

注: この例では、長い応答の最初の部分のみが表示されています。

ニコルソン氏は、GPT-3.5 に依存していた以前のバージョンの ChatGPT にも同様の支援を求めました。これもシラバスを提供していましたが、その提案はより一般的で、あまり役に立ちませんでした。

「精度の壁を突破した」とニコルソン氏は語った。「それはより多くの事実を含んでおり、それらは非常に多くの場合正しいです。」

AI 研究者で教授のオーレン・エツィオーニ氏は、初めて新しいボットを試したとき、「オーレン・エツィオーニとイーライ・エツィオーニの関係は何ですか?」と率直な質問をしました。ボットは正しく応答しました。

この質問に対する ChatGPT の以前のバージョンの答えは常に間違っていました。それが正しく行われているということは、新しいチャットボットがより幅広い知識を持っていることを示しています。

しかし、それでも間違いは起こります。

ボットは続けて、「オーレン・エツィオーニはコンピュータ科学者であり、アレン人工知能研究所（AI2）のCEOである一方、イーライ・エツィオーニは起業家である」と述べた。そのほとんどは正確ですが、8月に訓練が完了したボットは、エツィオーニ博士が最近アレン研究所の最高責任者を辞任したことに気づいていませんでした。

GPT-4 には、テキストだけでなく画像にも応答する新しい機能が備わっています。 OpenAI の社長兼共同創設者であるグレッグブロックマンは、このシステムがハッブル宇宙望遠鏡からの画像をどのように詳細に描写できるかを実証しました。説明は何段にもわたって続きました。

画像に関する質問にも答えられます。冷蔵庫の中の写真を渡されると、手元にあるもので作る料理をいくつか提案してくれる。

OpenAI はまだテクノロジーのこの部分を一般公開していませんが、Be My Eyes という会社はすでに GPT-4 を使用して、インターネット上で遭遇した画像や現実世界で撮影された画像についてより詳細なアイデアを提供できるサービスを構築しています。。

最近の夕方、ノースカロライナ大学チャペルヒル校の医学准教授で心臓専門医であるアニル・ゲヒ氏は、前日に診察した患者の病歴をチャットボットに説明し、その患者が治療後に経験した合併症も含めて説明した。病院に入院中です。説明には素人には理解できないいくつかの医学用語が含まれていました。

ゲヒ医師が患者をどのように治療すべきだったか尋ねたところ、チャットボットは完璧な答えを返しました。「それがまさに私たちが患者を治療した方法です」と彼は言いました。

彼が他のシナリオを試したときも、ボットは同様に印象的な答えを返しました。

その知識は、ボットが使用されるたびに表示される可能性は低いです。対応を判断し、医療処置を実行するには、ゲヒ博士のような専門家が依然として必要だ。しかし、コンピュータープログラミングから会計まで、さまざまな分野にわたってこの種の専門知識を発揮できます。

ニューヨークタイムズ紙の記事が提供されると、新しいチャットボットはほぼ毎回、記事の正確かつ正確な要約を提供できます。要約にランダムな文を追加し、その要約が不正確かどうかをボットに尋ねると、ボットは追加された文を指摘します。

エツィオーニ博士は、それは驚くべき技術だと言いました。「質の高い要約と比較を行うには、文章に対するある程度の理解と、その理解を明確に表現する能力が必要です」と彼は言う。「それは高度な知能の形態です。」

エツィオーニ博士は新しいボットに「歌手マドンナに関する斬新なジョーク」を依頼した。その返事は彼に感銘を与えた。それは彼も笑わせた。マドンナの大ヒット曲を知っている人なら、あなたも感動するかもしれません。

新しいボットは、定型的な「お父さんジョーク」以外のものを書くのにまだ苦労していました。でも前作よりは若干面白かったです。

A.S.博士エツィオーニは新しいボートにパズルを与えた。

システムは適切に応答しているようでした。しかし、その答えは、戦車や車の通行を妨げる可能性がある出入り口の高さを考慮していませんでした。

OpenAIのサム・アルトマン最高経営責任者（CEO）は、新しいボットは「少しは」推論できる可能性があると述べた。しかし、その推論能力は多くの状況で機能しません。 ChatGPT の以前のバージョンでは、高さと幅が重要であることが認識されていたため、質問をもう少しうまく処理できました。

OpenAIは、新システムにより、41の州と準州の弁護士に資格を与える統一司法試験で、学生の上位10％程度に入る可能性があると述べた。同社のテストによれば、SATでは1,300点（1,600点中）、Advanced Placementの高校試験では生物学、微積分、マクロ経済学、心理学、統計、歴史で5点（5点中）を獲得できるという。

このテクノロジーの以前のバージョンは、Uniform Bar Exam に不合格であり、ほとんどの Advanced Placement テストでもそれほど高いスコアを獲得できませんでした。

最近の午後、ブロックマン氏は試験スキルを証明するために、ディーゼルトラックの修理業を営む男性に関する数段落にわたる司法試験の質問を新しいボットに与えた。

答えは正解でしたが、法律用語がいっぱいでした。そこでブロックマン氏はボットに、素人向けにわかりやすい英語で答えを説明するよう依頼した。それもやりましたね。

新しいボットは、すでに起こったことについて推論しているように見えましたが、将来についての仮説を立てるように求められると、それほど熟練していませんでした。新しい推測を生み出すのではなく、他の人が言ったことを利用しているように見えました。

エツィオーニ博士が新しいボットに「今後 10 年間に NLP 研究で解決すべき重要な問題は何ですか?」と尋ねたところ、 — ChatGPT のようなシステム開発を推進する一種の「自然言語処理」研究について言及しています — まったく新しいアイデアを定式化することはできませんでした。

新しいボットはまだ何かを作り続けています。「幻覚」と呼ばれるこの問題は、主要なチャットボットすべてを悩ませています。システムは何が真実で何がそうでないかを理解していないため、完全に虚偽のテキストを生成する可能性があります。

最新のがん研究について説明した Web サイトのアドレスを尋ねると、存在しないインターネットアドレスが生成されることがありました。

Cade Metz はテクノロジーレポーターであり、『天才メーカー: Google、Facebook、そして世界に AI をもたらした異端児たち』の著者です。人工知能、自動運転車、ロボット工学、仮想現実、その他の新興分野をカバーしています。 @cademetz

Keith Collins はレポーター兼グラフィック編集者です。彼はビジュアルストーリーテリングを専門とし、政治とテクノロジーに焦点を当てた幅広いトピックをカバーしています。彼はコロンビア大学ジャーナリズム大学院で修士号を取得しています。 @コリンズケイス

兄弟である父親と息子であるただし、出入り口の高さまたは長さが有限である場合、オブジェクトの高さと長さが制限要因になる可能性があります。

ニュース