日本時間2024年5月11日14時22分
東京(時事通信)-東京工業大学や富士通株式会社などの研究チームは金曜日、日本のスーパーコンピューター「富岳」を使って、生成人工知能の基礎となり得る大規模な言語モデルを開発したと発表した。 。
富岳-LLMモデルは、学習データ全体の6割を占める日本語データを幅広く学習しており、地域のニーズに合わせた生成型AIの研究につながることが期待されています。
研究者らには、東北大学、名古屋大学、政府支援の研究機関理化学研究所、サイバーエージェント株式会社の研究者も含まれ、このプロジェクトを立ち上げた。 2023年5月に株式会社コトバ・テクノロジーズと共同開発 このプロジェクトでは、富士通と理化学研究所が共同開発したスーパーコンピューターを利用する。
富嶽LLMの日本語能力の高さは、俳句の巨匠・松尾芭蕉の句についての質問に流暢に答えることからも分かるという。
継続学習を使用する日本語機能を備えた他のほとんどのモデルとは異なり、富岳LLMは悪意のあるデータを含まないチーム独自のデータを使用してゼロからトレーニングされるため、学習プロセス全体を理解できるため、優れていると付け加えた。透明性とセキュリティの観点から。
また、GPU ではなく CPU を使用する富岳を使用して、チームが大規模な言語モデルのトレーニングに成功したことも重要です。
言語モデルのトレーニングでは、GPU を使用するのが一般的です。 しかし現在、世界共通言語モデルの開発競争が激しいため、言語が不足しています。
研究者らによると、富岳の計算能力は通信性能の向上によって強化されたという。
「富岳がもたらす課題を克服する能力を我々は証明できた」と横田亮・東京工科大学教授は記者会見で述べた。 「私たちは外国製品にまったく依存していない。これは大きな成果だ」と横田氏は付け加えた。
富岳-LLMのソースコードはすぐに公開されました。 富士通のWebサイトからも入手できます。
More Stories
Nintendo Switch の最高のグラフィックス: 7 年間にわたるサードパーティ開発者の才能の結晶
エヌビディアの失望で日本の日経平均株価が下落
Apple Intelligence の写真アプリのクリーンアップ ツールの動作をご覧ください