2023年6月18日 15時47分(日本時間)
最近、米国のスタートアップ企業が作成した会話型 AI モデルである ChatGPT が急速に登場し、日本のテクノロジー企業や研究機関が土着の生成型 AI ツールの中核技術の開発に乗り出すようになりました。
しかし、日本語情報だけをシステムに入力しただけでは利益を上げることは困難です。 企業は著作権侵害などの問題にも直面している。
株式会社サイバーエージェント同社は先月、日本語学習が可能な生成人工知能の中核技術であるラージ言語モデル(LLM)を発表した。 同社は昨年からそのシステムを開発している。
同社関係者は「日本語や日本文化の学習に強いLLMは少ない」と話す。
LLMは生成AIの中核となる技術です。 膨大な量のテキストを読み、フォローする確率を予測し、単語を操作して文章を作成および要約し、質問に答えることができます。 モデルの学習の尺度を示す尺度をパラメータと呼びます。
サイバーエージェントは、この技術とChatGPTを組み合わせることで、広告コピーを自動作成する取り組みを開始した。 例えば、「朝早く起きる20代の働く女性に向けた化粧品」と書いた後、「働く女性に時短・アンチエイジング化粧品を提供します」といった文章が作成されます。
ビットバレーとして知られる、東京都渋谷区に本社を置く別のスタートアップ企業rinnaも、日本語に特化した大規模な言語モデルを立ち上げた。 地元の観光地をお勧めするようシステムに尋ねると、システムは「ハチ公像」と答えた。 同社のモデル学習情報は主に日本に関するものでした。
富士通と東京工業大学などがスーパーコンピューター「富岳」を活用して日本語に特化したLLMの開発に着手した。 日本電信電話株式会社(NTT)も生成AI分野への参入を発表した。
利益と著作権の保護
AIの生成モデルの開発には巨額の資金が必要であり、日本企業は海外の競合企業に比べて出遅れている。 これらを構築するには、大量のデータを処理できる高性能なコンピューターが必要であり、大量の電力を消費するため電気代も高くなります。
ChatGPTを開発した米国企業OpenAIの最高経営責任者(CEO)サム・アルトマン氏は昨年、「ある時点で何らかの方法で収益化する必要がある」とツイッターで述べた。
また、日本語だけの情報を利用する場合、学習の根拠となるデータが限られてしまうという弱点もあります。
「日本語で情報が提供される LLM を使用しているのは、主に日本企業です。」と NTT データ インテリリンク株式会社のコンサルタント城塚音也氏は言います。
あたかも人間が作成したかのような文章や画像を生成する生成 AI ツールには、いくつかの課題があります。
ブルームバーグによると、ダウ・ジョーンズ・アンド・カンパニー社。 ウォール・ストリート・ジャーナルの発行者であるInc.は、記事の不正使用でOpenAIを非難した。 CNNも懸念を表明したという。
デモウェブサイトを運営する日本の企業は5月末、AIを利用して他人の作品を学習し、元の投稿者の許可なくよく似た作品を提示することを禁止した。 この動きは、不利益を被っていると感じているクリエイターたちの広範な不満に応えて行われた。
知的財産を専門とする弁護士の大沼志乃氏は「合成AIが生成した文章や画像が著作権侵害に問われる訴訟については明確な結論は出ていない」と述べた。 「日本のコンテンツクリエイターを保護し促進するために、この問題についての議論を直ちに進めなければなりません。」
More Stories
Nintendo Switch の最高のグラフィックス: 7 年間にわたるサードパーティ開発者の才能の結晶
エヌビディアの失望で日本の日経平均株価が下落
Apple Intelligence の写真アプリのクリーンアップ ツールの動作をご覧ください