人間には簡単だがAIには難しいテスト「ARC」を用いたコンテスト「ARC Prize 2024」が開催中だ。このコンテストでは総額110万ドル(約1億7780万円、1ドル=161円換算)以上の賞金を用意している。
この問題に対処するため、Webアプリケーション「Zapier」を手掛ける米Zapier社の共同創設者マイク・クヌープさんと、 Pythonライブラリ「Keras」の開発者で、米Googleの研究者であるフランソワ・ショレさんが提案する「ARC」(Abstraction and Reasoning Corpus)というベンチマークテストが注目を集めている。テスト内容は、カラフルなタイルが表現されたグリッド図形(3×3や4×4、5×5、7×7、9×9など)から、パターン(規則性)を見つけ、問題用のグリッド図形にその規則性に基づいたカラフルなタイルを表現するというもの。以下にテストのサンプルを6つ紹介。どちらも左の2~4つのサンプルを提示し、それらからパターンを見つけ、そのパターンに応じて右のアウトプットに答えを表現する。
ARC Prize 2024は、総額110万ドル(約1億7780万円、1ドル=161円換算)以上の賞金が用意され、グランプリの50万ドル(約8081万円)は、ARC-AGIの非公開評価セットで85%以上のスコアを達成した最大5チームに授与される(人間の正解率が平均84%なため)。ARCの歴史は19年に始まり、20年のKaggleでの最初の競争、21年の米ニューヨーク大学の研究、22~23年に開催したコンテスト「ARCathon」を経て、現在のARC Prize 2024に至っている。 Source: Francois Chollet、Mike Knoop、Bryan Landers、Greg Kamradt、Hansueli Jud、Walter Reade、Addison Howard(2024). ARC Prize 2024. Kaggle. https://kaggle.com/competitions/arc-prize-2024
日本 最新ニュース, 日本 見出し
Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。
AI「はっきりしませんが……」 “自信がないAI”に人はどう反応する? 米Microsoftらが400人以上で実験:Innovative Tech(AI+)米プリンストン大学とカナダと米国のMicrosoftに所属する研究者らは、自信がない回答をする大規模言語モデル(LLM)に対して人々はどう反応するかを調査した研究報告を発表した。
続きを読む »
LLMが別のLLMを何度も改善 より良い回答を出す最適化手法をAIが発見する技術 Sakana AIなどが開発:Innovative Tech(AI+)AIベンチャーのSakana AIやFLAIR、英ケンブリッジ大学、オックスフォード大学に所属する研究者らは、人間の介入を最小限に抑えて新しい最適化アルゴリズムをAIによって発見する手法を提案した研究報告を発表した。
続きを読む »
米Appleの独自AI「Apple Intelligence」の技術詳細 基盤モデルや学習データなどを解説:Innovative Tech(AI+)(1/3 ページ)米Appleは、年次開発者会議「Worldwide Developers Conference 2024」(WWDC24)において、iOS 18、iPadOS 18、macOS Sequoiaに統合される独自AI「Apple Intelligence」を発表した。このシステムの基盤モデルについて、簡潔にまとめる。
続きを読む »
「自称オープンソース生成AI」は本当に“オープン”なのか? 45種のAIモデルをオランダの研究者らが調査:Innovative Tech(AI+)オランダのRadboud University Nijmegenに所属する研究者らは、オープンソースと主張する生成AIを対象に、どの程度オープンなのかを調査した研究報告を発表した。
続きを読む »
ChatGPT vs. Wikipedia──生成AIの登場でウィキペディアはどう変わったか? 英国の研究者らが調査:Innovative Tech(AI+)英キングス・カレッジ・ロンドンに所属する研究者らは、2022年11月にChatGPTが一般公開されたことを受け、Wikipediaの利用状況にどのような変化が生じたのかを調査した研究報告を発表した。
続きを読む »
大学の試験を生成AIで回答してもばれなかった…… しかも高得点 英国の大学でこっそり検証:Innovative Tech(AI+)英レディング大学などに所属する研究者らは、大学の試験において生成AIで回答した答案がバレるかを抜き打ちで実施した現実世界のチューリングテストの研究報告を発表した。
続きを読む »