日本語AI生成に明るい未来はあるのか…ひらがな、カタカナ、漢字が入り混じる「言語構造の不利さ」が圧倒的な壁に
自然言語を処理する大規模言語モデルの開発は、グローバルな言語の英語を話す英語圏が有利で日本語は圧倒的不利だというが…日本企業が生成AIの分野で生き残る方法とは。『アフターChatGPT 生成AIが変えた世界の生き残り方 』(PHPビジネス新書)から一部抜粋・再構成してお届けする。
『アフターChatGPT』#3
日本語というマイナー言語ゆえの不利さ
生成AIの開発で日本企業が後れを取っている理由の一つとして、自然言語を処理する大規模言語モデルの開発は、英語圏のほうが有利だということがあるでしょう。
AIに自然言語を学習させるためのテキストデータは、日本語よりも、英語のほうが圧倒的に多くあります。
今さら言うまでもなく、英語は世界中で使われているグローバルな言語だからです。そのため、生成AIの自然言語処理は、英語での開発優先度が上がり、精度も最も高くなりやすいのです。
ChatGPTも、日本語にも対応していますが、英語で質問したほうが、より精度の高い回答をします。GPT‒3・5からGPT‒4へのアップデートによって日本語での精度も向上したのは喜ばしいことですが、それでも英語と比べると劣ります。
ほぼ日本という島国でしか使われていない日本語は、世界的に見ればマイナー言語です。その日本語を、わざわざ生成AIに学習させる優先順位は、海外の企業ならなおさら相対的に低くならざるを得ません。
市場規模を比較しても、何か特別な事業であったり狙いがあったりしなければ、生成AIの開発で鎬を削っている最先端企業があえて日本語への対応を優先させることはありません。

ひらがな、カタカナ、漢字が入り混じる…日本語構造の不利な面
日本語の構造にも不利な面があります。ひらがな、カタカナ、漢字が入り混じる上に、主語が省略されやすいなどといった日本語の特徴は、シンプルな構造の英語と比べると扱いにくいのです。
それぞれに固有の言語を持つ他国についても同じことが言えるかもしれませんが、少なくとも日本語ゆえの不利さがあることは頭に入れておいたほうがいいでしょう。
それでも、今、トレンドの波に食らい付いていかなければ、日本企業の比較優位性は、低いところから、さらに低くなってしまいます。
そのことを理解している先進企業は動き始めています。
2023年5月、メルカリがグループ内横断の生成AI・大規模言語モデル専門チームを新たに設置しました。同社の研究組織がこれまで培ってきたAI技術の知見を活かしつつ、生成AIと大規模言語モデルの既存プロダクトへの実装による生産性向上や課題解決を目指すと宣言しています。
日本語に特化すれば 日本企業が有利か?
日本語に特化した生成AIを開発するという道も、日本企業にはあるかもしれません。
例えば、LINEとNAVERは共同で日本語に特化した大規模言語モデル「HyperCLOVA」を開発しています。
ただ、日本企業や日本人ではなくても、生成AIに日本語を学習させることはできます。
Stability AI日本代表のジェリー・チーさんも流暢な日本語を話しますし、ChatGPT開発チームで日本担当のシェイン・グウさんは、日本で生まれ育った中国系カナダ人です。日本語で独自に開発したからといって、英語での最先端の開発状況を把握した上で、日本語にそのアルゴリズムのいいところを使うという順番に、勝てるとは限らないでしょう。
2023年4月に来日したオープンAIのサム・アルトマンCEOは、日本に拠点を設けることを検討していると発言しています。
ただ、かつて、グーグルが2001年に日本オフィスを最初の国際オフィスとして開設したにもかかわらず、デジタルの競争力では、日本は先進国のなかで非常に遅れた状態が続いており、利益も結局は海外に出てしまうことを考えると、手放しで喜ぶことではないでしょう。
難しそうなことは海外に「お任せ」。そんな甘い話はありません。自力で考えることを放棄した企業は方向性を失ってしまいます。

日本の強みが活きるのは 「遊び」のサービス
日本におけるテクノロジーの歴史を振り返ると、効率性や合理主義が重視されるアメリカとは異なる、独自のユニークさがあることに気付きます。それは「遊び」の領域から技術が発展していく点です。
2023年5月、LINEはChatGPTとのコラボレーションで、好きなAIキャラクターを作成し、会話ができるサービス「ドリームフレンド」をリリースしました。AIで作ったオリジナルキャラクターと会話し、育成できるというユニークなサービスです。こうした発想は、漫画やアニメが多い日本に生まれやすいでしょう。
画像生成AIのStable DiffusionやMidjourney、DALL・Eで「お絵かき」を積極的に楽しんでいるユーザーが多いのも、日本の特徴です。漫画やアニメなどの素地があるからでしょう。Midjourneyをベースにした「にじジャーニー」や、Stable Diffusionをベースにした「Novel AI」といった、アニメ風のイラスを描く画像生成AIの人気が高いことからも、それが窺えます。
日本企業が勝てる要素
テクノロジーを使った日本人の「遊び」が世界に広まった例としては、「絵文字(emoji)」があります。
日本の携帯電話「iモード」から生まれた絵文字は、カジュアルなコミュニケーションのために多くの人々に支持されています。2008年にはグーグルが日本の携帯電話の絵文字をUnicode(ユニコード)に加える計画を公表、世界中にemojiという言葉が普及するきっかけとなりました。
さらに遡れば、家庭用ゲーム機でも、任天堂のファミコンが世界を席巻しました。アメリカのアタリが大きなシェアを占めていた北米市場を、後発の任天堂が奪ったのです。「スーパーマリオブラザーズ」は世界的なコンテンツになりました。2023年に公開された、CGを駆使した映画も大人気です。
コンテンツやテクノロジーの活用でどれだけユーザーの心を動かせるか、という勝負においては、日本企業が勝てる要素があります。
生成AIにおいても、日本企業は技術的な優位性においては現状で負けていますが、独自のコンテンツを活用したビジネスであれば、チャンスをつかめる可能性がまだあるはずです。
極端な話、プログラミングやエンジニアリングの専門知識がない中学生であっても、生成AIが専門性を補完してくれることで、ユニークなサービスを生み出すことが可能かもしれません。
スタートアップにもチャンスがあります。大企業は目をつけないようなニッチな領域を複数見つけて生成AIを活用し、サービスを拡大・統合させながらコングロマリットになっていく、というルートもあるはずです。

画像生成AIの活用に日本企業の勝機がある
世界的に見て、日本企業に残されている生成AIの独自のビジネスチャンスは、対話型AIだけではなく、画像や音楽など、非言語のジャンルにもあると個人的には思っています。
日本語がマイナー言語ゆえの不利さは前述した通りですが、画像などであれば、一点突破のチャンスがあります。
ZOZOは、2022年12月にリアル店舗をオープンさせ、同社独自のAI「niaulab AI by ZOZO」とプロのスタイリストが顧客に合ったコーディネートを無料で提案するサービスを開始しました。AIと人間のプロが知見をかけ合わせてファッションを提案するというこの取り組みも先進的と言えるでしょう。
一方で、チャンスが渦巻くマーケットにはリスクも必ず潜んでいます。
例えば、自社サービスで使いたい生成AIを開発しているスタートアップに出資をしようとしても、現在の生成AIの投資市場は待機資金が積み上がっている状態で、バブルになる可能性もあります。
また、過去に日本企業がAI分野で世界的ないい投資をできた事例は、残念ながらほぼありません。日本企業が周回遅れである自覚を持ち、投資でババを引かされないように警戒する必要もあるでしょう。
文/山本康正 写真/shutterstock
『アフターChatGPT 生成AIが変えた世界の生き残り方 』(PHPビジネス新書)
山本康正 (著)

2023/7/1
¥935
192ページ
978-4569855127
【新浪剛史氏(サントリーホールディングス社長)推薦!】
「この新潮流に、いかに乗るかがビジネスの命運を決める。全ビジネスパーソン必読。」
人間の仕事は、いよいよ奪われるのか?
未曽有のスピードで進む変化の本質を
世界のテクノロジーとビジネスの「目利き」が解説
「生成AI」への注目が急速に高まっている。
とりわけ対話型AI「ChatGPT」は、2022年11月30日に公開されるや、史上最速級のスピードでユーザー数を増やした。アイデア出しや業務効率化など、仕事への活用も急速に進んでいる。テキストで指示をすると自動で画像を生成するAIも続々と登場。
マイクロソフトやグーグルなどのビッグテックからスタートアップまで、生成AIをめぐる競争が激化するなか、私たちの仕事やビジネスはどう変わるのか? どう変わるべきなのか?
【本書の内容】
第1章 ChatGPTの衝撃
第2章 なぜ今、生成AIが登場したのか
第3章 「アフターChatGPT」のビジネス
第4章 日本企業は「アフターChatGPT」をどう生きればいいのか
関連記事




TikTokの創業者ジャン・イーミンとは何者だ…元マイクロソフト、AI時代の到来を予測し、2011年に起業した驚くべき天才の正体
『最強AI TikTokが世界を呑み込む』#1

乗り遅れたら日本は危ない!経済学者が見通す世界的なAI大変化の時代
