東大松尾研究室発のAIベンチャー「ELYZA」は3月13日、700億パラメーターの最新日本語大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-70b」を発表した。
具体的にはLlama 2に対し、日本語による追加事前学習と事後学習を実施。追加事前学習には約100Bトークンの日本語コーパスを用い、事後学習には「日本語での指示追従能力と一般的な知識を向上させることを目的としてELYZAが独自に構築した高品質なデータセット」を用いているという。なお、これまでのようなオープンソースでの公開ではなく、同モデルを含むELYZAの日本語LLM群を「ELYZA LLM for JP」シリーズとし、2024年春以降API提供という形で(恐らく)有償公開ということになるだろう。LLMの指示に従う能力や、ユーザーの役に立つ回答を返す能力を測ることを目的とした日本語ベンチマーク「Tasks
100」による評価では、同じくメタの「Llama 2 70B」をベースとする他の日本語 LLM国内モデルの中で1位となっている。さらに、「Claude Instant」や「GPT-3.5 Turbo 」といった海外のモデルを上回り、その他のグローバルモデルとも遜色ないスコアを獲得した。Stability AIが提供するLLMの対話性能を測るためのベンチマーク「MT-Bench」を日本語訳して作られた「Japanese MT-Bench」による性能評価では、グーグルの「Gemini 1.0 Pro」や「GPT-3.5 Turbo」を総合スコア(平均)で上回っているほか、「stem」など一部のカテゴリーでは「GPT-4」を上回る数値さえ見せている。
日本 最新ニュース, 日本 見出し
Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。
GPT-3.5�Ő��������Θb��ȃf�W�^���ȃ}�������E�������[�ASXSW�Ńf�r���[60�N�ȏ�O�ɖS���Ȃ����l�C���D�A�}�������E�������[�̃��A���ȃf�W�^���ł�SXSW�Ńf�r���[�����B�Θb�҂̕���ɉ������Ή�����A��b����L����B
続きを読む »
GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。
続きを読む »
Anthropic、最新AIモデル「Claude 3」を公開--複数分野で「GPT-4」を上回るChatGPTに対抗する生成AIサービス「Claude」に、最新版である「Claude 3」が発表された。運営会社によれば、Claude 3の性能はいくつかの点でOpenAIの「GPT-4」を上回るという。
続きを読む »
NBA八村塁、いよいよ才能開花 名門で欠かせぬ存在に「一時期、噂されたトレードが実現しないで本当によかった」ロサンゼルス・レーカーズのファンは今ごろ、八村塁のプレーを見ながらそう感じているのではないか。NBA5年目を迎えた八村は2023〜24シーズン後半、一皮むけたと周囲に思わせるプレーを続けている。8日のバックス戦前の時点で平均12.5得点、3.7リバウンドというシーズン成績は過去4年とさほど変わらないが、直近の10戦では平均17.3得点(
続きを読む »
アートフェア東京が閉幕。来場者数は5.5万人を記録アートフェア東京が閉幕。来場者数は5.5万人を記録 エートーキョー株式会社のプレスリリース
続きを読む »