日本の AI 環境の強化に向けた大きな一歩として、Stable Diffusion を支える大手 AI 企業である Stability AI は、Japanese StableLM Alpha として知られる初の日本語モデル (LM) を導入しました。 同社がLMモデルが日本語話者向けの最も効率的な公開モデルであることを確認したため、この大規模な発売は注目を集めた。 この主張は、他の 4 つの日本の LM に対する包括的な参考評価によって実証されました。
70 億パラメータの印象的なアーキテクチャを特徴とするこの新しく導入された日本版 StableLM Alpha は、Stability AI の技術進歩への取り組みの証です。 このフォームは、さまざまな言語タスクに対応する多用途で高性能なツールです。 同社は複数のカテゴリーで同時代の企業を上回り、業界のリーダーとしての地位を確立しています。
日本語の StableLM Base Alpha 7B 商用リリースは、広く認知されている Apache 2.0 ライセンスに基づいてリリースされる予定です。 この特殊なモデルは、オンライン リポジトリから注意深く調達された日本語と英語のスクリプトからの 7,500 億文字の膨大なデータ セットに対する広範なトレーニングを通じて細心の注意を払って構築されています。
この成果は共同の取り組みによって支えられています。 Stability AI は、EleutherAI Polyglot プロジェクトの日本チームの専門知識を活用し、日本のコミュニティによって Stability AI のために設計されたデータセットとして完成しました。 この共同の取り組みは、Stability AI 開発プロセスの基礎である EleutherAI の GPT-NeoX ソフトウェアの拡張バージョンの使用によって促進されます。
同様のイノベーションである日本の StableLM Instruct Alpha 7B は、新たなマイルストーンをマークします。 このテンプレートは主に研究目的で設計されており、研究アプリケーションのみを対象としています。 これは、複数のオープン データセットを使用した監視微調整 (SFT) として知られる体系的なアプローチを通じて達成される、ユーザーの指示に従う明確な能力を示します。
これらのモデルは、Eleutheray 言語モデル評価ツールを使用した厳密な評価を通じて検証されました。 モデルは、文の分類、文のペアの分類、質問応答、文の要約などのさまざまなドメインにわたって監査され、平均 54.71% という優れたスコアが得られました。 安定性 このベンチマーク AI は、Alpha 7B を指示する日本の StableLM を同時代の AI よりも明らかに優れており、その優秀さと優位性を強調しています。
興味深いことに、LM の Stability AI の日本での発売は、ソフトバンクの最近の発表とのタイミングの関係で、別の陰謀をもたらしています。 先週、ソフトバンクは日本市場向けに設計されたローカルラージ言語モデル(LLM)分野のプロジェクトを発表した。 同社の取り組みは、今年後半にデビューする予定の生成 AI コンピューティング プラットフォームに約 200 億円 (1 億 4,000 万ドル以上) という多額の資金が割り当てられていることによって強調されています。
状況が進化し続けるにつれ、最終的にどの日本語モデルが動的に進化する生成 AI 分野での優位性を確立するのかを見極めるのが待ち遠しいゲームになります。
をスキャンします プロジェクト。 この研究の功績はすべて、このプロジェクトの研究者に与えられます。 また、忘れずに参加してください 28,000+ML サブ Redditそして 40,000 以上の Facebook コミュニティ、 ディスコードチャンネルそして そして メールマガジンでは、最新の AI 研究ニュースやクールな AI プロジェクトなどを共有します。
Niharika は、Marktechpost のテクニカル コンサルタント インターンです。 彼女は学部 3 年生で、現在、カラグプールのインド工科大学 (IIT) で技術学士号の取得を目指しています。 彼女は、機械学習、データ サイエンス、人工知能に強い関心を持ち、これらの分野の最新動向を熱心に読んでいる非常に意欲的な人物です。
「不治の思想家。食品愛好家。微妙に魅力的なアルコール学者。ポップカルチャーの擁護者。」
More Stories
Nintendo Switch の最高のグラフィックス: 7 年間にわたるサードパーティ開発者の才能の結晶
エヌビディアの失望で日本の日経平均株価が下落
Apple Intelligence の写真アプリのクリーンアップ ツールの動作をご覧ください