
トヨタグループが“究極の願い”として掲げる「交通事故ゼロ」の社会。その実現に向けトヨタは、運転だけでなくインフラや周辺環境も自動で制御する研究を進めている。そのベースとなる技術で、この分野では世界をリードする独自開発の最先端AIが、4月にトヨタの実証実験都市「ウーブン・シティ」で初めて公開された。
【写真を見る】「交通事故ゼロ」社会を目指すトヨタの最先端AI~「ウーブン・シティ」で独自開発の技術を初公開~【調査情報デジタル】
「ウーブン・シティ」で初公開
静岡県裾野市の「Toyota Woven City(以下、ウーブン・シティ)」は、トヨタグループの一員であるWoven by Toyotaが運営する「実証実験の街」だ。2025年9月から居住と実証が始まり、現在は約100人が暮らしている。このウーブン・シティに2026年4月、発明を加速させる開発拠点「Inventor Garage(以下、インベンターガレージ)」がオープンした。
インベンターガレージは、かつてトヨタ自動車東日本が操業していた、東富士工場のプレス工場建屋をリノベーションしたもの。創業時からの床や柱、ロボットや不具合を知らせる信号など、工場の面影が残されている。この場所で、インベンターと呼ばれる24の企業や団体などが、実証実験を通してプロダクトやサービスの開発を行う。
もちろん、Woven by Toyotaも新たな発明を担っている。約2500人の従業員を擁するWoven by Toyotaは、ウーブン・シティで未来のインフラを作り、運営していくことに加えて、ソフトウェアを作る会社でもある。
インベンターガレージのオープンにあわせて開催されたイベントが、「Kakezan 2026」。このイベントで、Woven by Toyotaが2023年4月に設立されて以来、自社で開発してきたソフトウェアプラットフォームなどが初めて公開された。その核となるのは最先端のAI技術だ。
AIが自動運転の性能を引き上げる
会場には、モビリティ技術からロボット、事故のない街を作るためのインフラなど、さまざまな技術が公開された。その一つが、開発中の自動運転技術だ。
トヨタグループでは、1990年代後半から自動運転技術の研究を進め、2010年代から公道試験などを実施してきた。ただ、当時はルールベースでの制御が中心だった。
ルールベースとは、あらかじめ設定されたルールに基づいて判断を行う自動システムのことで、ルールの設定や課題の解析などはエンジニアが手作業で行っていた。
それが、生成AIの一種と言える大規模言語モデル(LLM)が劇的に進化した2023年頃から、自動運転技術もLLMを中心とした開発に進化した。その結果、AIが大量のデータを取得して学習することが可能になり、自動運転技術は飛躍的に向上している。
開発リーダーの黒田龍介さんは、AIの活用を次のように解説する。
「私たちは自動車に搭載するAIを使った自動運転技術と、この技術をいかに継続的に成長させて、改善させていくかといった開発環境を両輪で作っています。開発環境にもAIを使っていて、AIが自動運転の性能を引き上げています」
AIによる開発プロセスでは、ユーザーの車で実際に発生している課題や、ヒヤッとした場面などのデータをクラウドに吸い上げ、自動で解析する。その際に、どの課題から解決するのかについて優先順位をつけて、その課題に似たデータを集め、データセットを作成。これらのデータをAIに学習させて、解決策をシミュレーションする。このサイクルを高速かつ高性能で回すことで、自動運転システムの性能を上げている。
また、集まった膨大なデータの中から、本当に必要なデータをAIによって自然言語で呼び出すこともできる。例えば「animal on road」と入力すると、最近北海道でデータが収集されたばかりの「キツネが車の前方を歩いている映像」が出てくる。
ただ、課題に対処するために必要なデータを、車から収集するだけで全て賄うことは難しい。そこで、事故に至る直前のシーンなどの動画をAIで生成して、シミュレーションすることも可能だ。
黒田さんは自動運転技術の開発について「人間が方向性や戦略を決めて、システムが自動で技術を賢くしてくれることを目指しています」と説明した。
映像を自然言語化する視覚言語モデル(VLM)を開発
自動運転技術とともに、交通事故ゼロを目指すためにWoven by Toyotaが独自に開発し、世界で注目を集めている技術が、今回初めて製品として公開された。「Woven City AI Vision Engine」と名付けられた、映像解析のためのマルチモーダル大規模基盤AIだ。
マルチモーダルとは、テキストや画像、動画、センサーのデータなど、複数の異なる種類のデータを統合して処理する技術のこと。このAIは街や施設に設置されたカメラ映像を解析して、映像の前後の文脈も含め瞬時に自然言語化する「視覚言語モデル(Vision Language Model=VLM)」と呼ばれるものだ。Woven by Toyotaが独自で開発した基盤AIであり、VLMとしては世界トップレベルの性能を誇っているという。
会場で、Woven City AI Vision Engineと繋がったカメラの前に立ってみた。すると、タブレットの画面に次の文章(実際は英文)が瞬時に現れた。
「コンベンションセンターや広いホールのような広い室内空間に人々が集まっています。そこは明るく、天井が高く、背景には工業的なスタイルの照明器具が見えます。人々はカジュアルな服装をしていて、ジャケットを着ている人もいれば、Tシャツ姿の人もいます。彼らは会話を楽しんだり、背景にある何かを観察したりしているようです。全体的な雰囲気はカジュアルでリラックスしていて、おそらく人々が交流している社交的な集まりやイベントのようです」
このように、映像で捉えた空間の全体像から、人々の服装やそれぞれの動き、それに雰囲気までも文章にしていた。開発マネージャーの小竿陽平さんは、このAIを使った自動運転の検証を、ウーブン・シティ内で行っていると明かす。
「車に搭載したドライブレコーダーなどのカメラでは、建物の影に隠れているものは検知できません。それが、ウーブン・シティには街のインフラに多数のカメラが設置されていますので、このカメラのデータとAIをつなげることで、建物の影に隠れた人がこの後道路に出てきて、横断歩道を渡ろうとすることなどがテキストで記述されます。この情報をもとに、AIが危険度を三段階に色分けして、車やドライバーに知らせる検証をしています」
また、自然言語化するシステムは、自動運転だけでなく幅広い業界でも利用できる。小売店に導入された場合には、店内のカメラに映った映像から人の動きが細かく記述される。記述された一定時間内の主な出来事を、ChatGPTを使って瞬時にレポートとしてまとめることもできる。実際に警備や防犯、マーケティングなど、異業種への販売が始まっている。
会場ではこのほかにも、トヨタグループによるさまざまなAI技術が展示された。「Woven City Robot Platform」では、ロボットにスプーンなどをつかむ動作を覚えさせているところが公開されたほか、トヨタ自動車の豊田章男会長に代わって質問に答える「豊田章男AI」も登場した。
AIを活用することによって、人、モビリティ技術、インフラをデータで繋ぎ、交通事故のない社会を目指しているトヨタグループ。その技術を進化させているのは、ウーブン・シティと運営会社であるWoven by Toyotaが開発した最先端のAIであることが今回の取材で垣間見えた。
「調査情報デジタル」編集部
【調査情報デジタル】
1958年創刊のTBSの情報誌「調査情報」を引き継いだデジタル版のWebマガジン(TBSメディア総研発行)。テレビ、メディア等に関する多彩な論考と情報を掲載。原則、毎週土曜日午前中に2本程度の記事を公開・配信している。
・「コバエが、料理に一瞬だけ止まってしまった!」その料理、衛生的に大丈夫?専門家に聞いた
・“ポカリ”と“アクエリ” 実は飲むべき時が違った! “何となく”で選んでいませんか?効果的な飲み分けを解説【Nスタ解説】
・「少女は捨て駒」小5で初めてパパ活…非行が低年齢化 “居場所”を求め公園をさまよう少女たち【報道特集】
