Beyond the Breaking News

GPT-OSS Swallow (120B) が日本語タスクで最高性能を達成:オープン大規模言語モデルの新たな指標

テクノロジー News

GPT-OSS Swallow (120B) が日本語タスクで最高性能を達成:オープン大規模言語モデルの新たな指標
GPT-OSS Swallow大規模言語モデル日本語

総パラメータ数1200億以下のオープンな大規模言語モデル「GPT-OSS Swallow (120B)」が、日本語タスクで平均スコア0.642を達成し、最高性能を記録。ベースモデルgpt-oss-120bと比較してほぼ全てのタスクで性能向上、特にJamC-QAでの顕著な改善が確認された。英語タスクの比較結果と、今後の課題、Qwen3 Swallowの学習プロセスについても言及。

以下に示すグラフは、 大規模言語モデル 「GPT-OSS Swallow (120B)」の 日本語 タスクにおける卓越した性能を示しています。このモデルは、総パラメータ数が1200億以下のオープンな 大規模言語モデル の中で、平均スコア0.

642を達成し、最高性能を記録しました。特筆すべきは、ベースとなったgpt-oss-120bと比較して、ほぼ全てのタスクで性能向上が見られた点です。日本の知識量を測るJamC-QAにおいては、顕著な改善が確認されており、日本語能力の向上に大きく貢献していることが伺えます。この成果は、オープンソースの言語モデル開発における重要な進展であり、今後の更なる発展が大いに期待されます。モデルの設計と学習戦略の最適化により、高い精度と効率性を両立していると考えられます。研究チームは、このモデルの更なる改善を目指し、継続的な開発を進めていく方針です。特に、英語タスクにおける性能向上と、多様な分野への応用可能性を探求していくことが重要となります。\次に、英語タスクにおける性能比較のグラフに注目します。このグラフは、「GPT-OSS Swallow (120B)」(オレンジ色)に加え、「Qwen3-Next-80B-A3B-Thinking」(青色)、「gpt-oss-120b」(緑色)、「Qwen3-235B-A22B-Thinking-2507」(赤色)、そして「GPT-5 mini」(紫色)の性能を比較しています。GPT-OSS Swallow (120B)は、英語タスクにおいても、総パラメータ数が1200億以下のオープンな大規模言語モデルの中で高いパフォーマンスを示しています。しかしながら、科学分野においては、ベースモデルであるgpt-oss-120bと比較して性能が低下する課題も明らかになりました。この結果は、モデルの得意分野と苦手分野を理解し、今後の開発において、科学分野における性能改善に焦点を当てる必要性を示唆しています。研究チームは、この課題を克服するために、様々な技術的アプローチを検討しており、より汎用性の高いモデルの開発を目指しています。例えば、科学的な知識をより多く学習させるためのデータセットの拡充や、モデルのアーキテクチャの最適化などが考えられます。\「Qwen3 Swallow」モデルは、Qwen3 Swallow 8B、30B-A3B、32Bを基盤として、継続事前学習(CPT)、教師ありファインチューニング(SFT)、そして強化学習(RL)という3段階の学習プロセスを経て開発されました。この多段階の学習アプローチにより、モデルの精度と安定性が向上し、様々なタスクに対応できるようになりました。CPTは、大規模なテキストデータセットを用いてモデルを継続的に事前学習させることで、基礎的な言語能力を向上させます。SFTは、特定のタスクに関する教師データを用いて、モデルを微調整することで、タスク固有の性能を向上させます。RLは、モデルの出力を評価し、より良い結果を出すようにモデルを学習させることで、モデルの洗練度を高めます。これらの学習方法の組み合わせにより、「Qwen3 Swallow」モデルは、高いパフォーマンスを発揮できるようになり、今後の言語モデル開発の新たな可能性を切り開いています。研究チームは、このモデルを基盤として、さらなる性能向上と、新たな応用分野の開拓を目指しており、今後の動向が注目されます

We have summarized this news so that you can read it quickly. If you are interested in the news, you can read the full text here. Read more:

gigazine /  🏆 80. in JP

GPT-OSS Swallow 大規模言語モデル 日本語 性能評価 オープンソース Qwen3 Swallow Jamc-QA

 

United States Latest News, United States Headlines

Similar News:You can also read news stories similar to this one that we have collected from other news sources.

リコー、オープンウェイトモデル「gpt-oss-120B」をオンプレ環境で提供開始:AIニュースピックアップリコー、オープンウェイトモデル「gpt-oss-120B」をオンプレ環境で提供開始:AIニュースピックアップリコーはOpenAIのオープンウェイトLLM「gpt-oss-120B」をオンプレ環境で検証し提供を開始した。今秋、同社のスターターキットにも搭載予定で、生成AIの業務活用を高度化し企業の選択肢を拡大させる。
Read more »

これは事件だ。“賢い家庭内LLMの夢”を叶える「gpt-oss-120b」、動かし方を教えますこれは事件だ。“賢い家庭内LLMの夢”を叶える「gpt-oss-120b」、動かし方を教えます今年(2025年)の8月5日に、ChatGPTでお馴染みOpenAIからオープンウェイトな「gpt-oss-20b」と「gpt-oss-120b」がリリースされた。このうち前者の20bの方は32GBのメモリがあればそこそこ動くので、すでに実践されている方も多いかもしれない。「ではより大規模で賢い120bをPCで動かすにはどうすればいいのか!? 」……を、3つのパターンに分けてご紹介したい。
Read more »

GPT-OSS-120Bモデル利用に必要なPCスペックと周辺機器GPT-OSS-120Bモデル利用に必要なPCスペックと周辺機器GPT-OSS-120Bモデルを快適に利用するためのPC環境について解説。必要なメモリ容量、VRAM、設定変更、関連PC製品を紹介。
Read more »

サードウェーブ、NexTech Week 2025 秋に出展:最新AIワークステーションでAI開発を加速サードウェーブ、NexTech Week 2025 秋に出展:最新AIワークステーションでAI開発を加速サードウェーブは、NexTech Week 2025 秋 AI・人工知能 EXPOに出展し、最新GPU「NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition」を4基搭載したハイエンドワークステーションを披露。OpenAIの大規模オープンモデル「gpt-oss-120b」のデモンストレーションも実施し、AI開発の効率化を支援。
Read more »

DIVX、クラウドに頼らず閉域環境で大規模言語モデル「gpt-oss(120B/20B)」を導入できる「DIVX Local LLM」を発表DIVX、クラウドに頼らず閉域環境で大規模言語モデル「gpt-oss(120B/20B)」を導入できる「DIVX Local LLM」を発表DIVX、クラウドに頼らず閉域環境で大規模言語モデル「gpt-oss(120B/20B)」を導入できる「DIVX Local LLM」を発表 株式会社divxのプレスリリース
Read more »

【gpt-oss-120b対応】オンプレミス型生成AI議事録ソリューション本格提供開始【gpt-oss-120b対応】オンプレミス型生成AI議事録ソリューション本格提供開始【gpt-oss-120b対応】オンプレミス型生成AI議事録ソリューション本格提供開始 株式会社Ippu Senkinのプレスリリース
Read more »



Render Time: 2026-05-28 23:10:07