AIがあたかも本当のように事実と異なることを言ってしまうハルシネーション(幻覚)。AIの精度の高さを証明する指標の1つであるこのハルシネーションレートのランキングで、OpenAI o1 miniやGPT-4oを抑えてトップに輝いたのは中国製AIだ。
AIがあたかも本当のように事実と異なることを言ってしまうハルシネーション(幻覚)。どのくらい幻覚を見るかを示すハルシネーションレートは、各社がしのぎを削る大規模言語モデル(LLM)の精度の高さを証明する1つの指標となっている。を見ると、現在(2024年9月13日付け)は中国版ChatGPTとも言われる「智譜AI(Zhipu AI)」のGLM-4-9B-Chatが1.3%でもっともハルシネーションレートが低い。出たばかりのOpenAI o1 miniの1.4%、GPT-4oの1.5%を抑えての1位は正直すごい(冒頭のグラフ参照のこと)。
そういえば先日、コープさっぽろCIOの長谷川秀樹氏が「ハルシネーションがある限り、企業では生成AIは使えないというCIOが多くて驚いた」とOpenAIイベントでの感想をSNSでコメント。確かに、この先も日本企業はハルシネーションレート0%まで求め続けるのだろうか? 長谷川氏も同じ投稿で「人間オペレーションの方が、ハルシネーション多くね?www」とコメントしていたけど、まさにそうだなと。明らかにハルシネーションみたいな発言をする人ってどこにでもいますよね。ASCII.jpのクラウド・IT担当で、TECH.ASCII.
日本 最新ニュース, 日本 見出し
Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。
OpenAI、推論する新AIモデル「o1」を発表。規模以外での進化を示す新AIモデル「OpenAI o1」の詳細を、OpenAIが『WIRED』に明かした。「Strawberry」というコードネームで呼ばれていたこのモデルは難問を段階的に解決する「推論」の部分で進化を遂げている。次のモデルである「GPT-5」にもこの要素は生かされるという。
続きを読む »
TechSuite株式会社、生成AIを活用したSEO記事執筆サービス「バクヤスAI 記事代行」にOpenAI社から発表された新モデル「OpenAI o1-preview」を実装TechSuite株式会社、生成AIを活用したSEO記事執筆サービス「バクヤスAI 記事代行」にOpenAI社から発表された新モデル「OpenAI o1-preview」を実装 TechSuite株式会社のプレスリリース
続きを読む »
OpenAI新モデル「o1」GitHub Copilotにも順次導入へマイクロソフトは9月12日(現地時間)、OpenAIが発表した最新のAIモデル「GPT-o1-preview/o1-mini」をGitHub Copilotに順次導入することを明らかにした。
続きを読む »
OpenAI「o1」は人間のような“想像力”を持ち、AGIへの重要な一歩となる (1/3)米OpenAIは9月12日(現地時間)、新たなAIモデル「OpenAI o1」を発表。ユーザーの入力に対してじっくり考えてから返答することで、より複雑なタスクを正確に解決できるようになった。
続きを読む »
OpenAI、よく考えて回答する新AIモデル「OpenAI o1」を発表時に回答が拙速になるという「ChatGPT」の問題点に対処し、科学やコーディングの問題にじっくり取り組むよう設計された新モデル「OpenAI o1」のプレビュー版が発表された。
続きを読む »
OpenAI、数学的思考力がすごいAIモデル「o1-preview」 深く考えることで難問を解くOpenAIが9月12日、「Strawberry」と呼ばれていた次世代AIモデル「o1-preview」をついに発表した。複雑な問題に対してより長い時間をかけて思考し、科学、コーディング、数学などの分野で従来のモデルを凌駕する能力を持つとされている。
続きを読む »