Siriの誕生をめぐる話、あるいは米国民の税金が音声エージェントに化けた件
概要:iPhone 4Sの音声エージェントSiriは、イノベーションがどうやって生まれるかを考える格好の事例である。この記事ではSiriの出自を遡りながら、基礎研究の重要性を考える。

アップルの新作iPhone 4Sは、名前どおりiPhone 4からそれほど変化がない。デザインはほぼ同じだし、プロセッサやカメラは高性能になったが、もともと貧弱だったわけでもない。だからiPhone 4Sの話題が、新機能の音声エージェントSiriに集まるのは、ある意味で当然と言える。
アップルが音声で操作できる「電子秘書」(エージェント)をiPhoneに組み込むらしい、という予測は以前からあった。理由は簡単で、アップルが2008年8月にエージェント開発企業を買収していたからだ。その企業は名前をSiriといい、SiriというiPhoneアプリを2010年2月から提供していた。当時の動画を見れば、現在のSiriの基本機能がアップルに買収される前からすでにほぼ実現していたことが分かる。
つまりアップルは、サードパーティで提供されていたアプリの開発企業を買収し、iPhone 4Sの基本機能としたわけだ。買収額は明らかになっていないが、Business Insiderは1億ドルから2億ドルと報じている。
(ちなみに、このアプリ版SiriはiPhone 4Sの発表後、サービス終了が伝えられた。アプリ版はiPhone 4でも利用できたのだが、4S限定機能としたのはマーケティング上の問題だろうか。中にはiPhone 4SのSiriをiPhone 4やiPadへ移植しようという動きも出ている)
Siriという企業は、SRIインターナショナルからのスピンオフとして、2007年10月に設立された。いわゆるベンチャー企業である。おおもとのSRIインターナショナルは米国を代表する研究機関であり、米国政府などから年5億ドルほどの資金を集めて、2000人以上のスタッフが様々な研究を行っている。
このSRIインターナショナルは、2003年から2008年までの5年間、CALOというプロジェクトを実施していた。25以上の大学や研究所と連携した大プロジェクトで、その予算規模は少なく見積っても1.5億ドル程度である。
CALOは”Cognitive Assistant that Learns and Organizes”の略であり、日本語で言えば「学習のうえ整理する認知アシスタント」ということになる。ようするにエージェントのことだ。SRIから見れば、5年にわたるエージェント研究の成果をベンチャーとして切り離し、SRI自身とベンチャーファンドによる支援を行ったのち、アップルに売り払ったということになる。
そして、CALOプロジェクトに1.5億ドルの助成を行ったのが、DARPAである。DARPAはDefense Advanced Research Projects Agencyの略で、日本では国防高等研究計画局と呼ばれる。アメリカ国防総省下の機関であり、軍事用技術の研究開発を行っている。GPSが軍事技術であることを知る人は多いかもしれないが、このGPSをもともと開発したのがDARPAだ。インターネットの先祖であるARPANETもDARPAによるものである。最近だと、インターネットで人気の四足ロボット、Big DogのBoston Dynamics社もDARPAから支援を受けている。
DARPAは以前、PALと呼ぶ研究プログラムを実施していた。”Personalized Assistant that Learns”の略で、つまり「学習するパーソナルアシスタント」である。もちろん用途は軍事だ。戦場における状況変化に対応し、助けてくれる人工知能というわけである。このPALプログラムにおいて契約を勝ち取ったのがSRIで、SRIはそのお金でCALOプロジェクトを実現した。
DARPAは国の組織であり、運営資金は、平たくいえば税金である。単純化して言えば、米国民の税金が(あるいは国債を買った外国人のお金も)、DARPAに渡り、それがSRIインターナショナルの研究資金となって、その成果がアップルのiPhone 4Sに搭載され、米国民(とそのほか多数の国の人々)の手に渡ったわけだ。まさに産学官連携だ。
もちろん、米国においてもすべての新技術がこうした産官学連携から生まれるわけではない。Siriは特別な例かもしれない。それでも、目新しい技術の背後に長い地道な基礎研究があることを、あらためて示しているのは確かだ。
なぜ日本でiPhoneが生まれなかったのか、なぜスティーブ・ジョブズが日本に存在しないのか、そのような答えのない問いを投げかけるのは簡単だ。しかし本当に考えるべきは、未来のために今どのような研究を行うかではないだろうか。ただお金をかければいいわけではないが、お金をかけなければ、新しい技術は生まれない。新しい技術が生まれなければ、新しいビジネスも生まれない。
米国では良くも悪くも、軍の研究にお金を注ぎ込むというコンセンサスがあり、そこから新しい技術が生まれている。日本が技術立国の道を今後も歩むつもりならば、同じようなコンセンサスが必要だろう。日本企業に元気がないというのは、ただ企業経営だけの問題ではない。私たちはいったい、なにを研究すべきだろうか?
いくつか余談を。まず、アップルは1987年当時カラ音声エージェントKnowledge Navigatorの構想を示していた。もっとも、ジョブズのいない時期だったせいか、アップルは今回のSiriと結びつけようとしていない。
残念ながら、Siriはいまのところ英語とフランス語、ドイツ語にしか対応しない。しかし2012年には日本語にも対応する予定である。また、SiriのCEOだったDag Kittlau氏は、新しい研究テーマを求めて、すでにアップルを退社した。そのアップルは先日、C3という地図データ開発企業を買収した。C3を生んだのは、スウェーデンの軍事企業SaaBである。そしてDARPAはBOLT(Broad Operational Language Technology Program)と呼ばれる他言語翻訳の研究をはじめている。
関連情報:
- アップルのSiri買収を伝えるBusinessInsiderの記事
- SRIのFAQページ
- SRIのCALOプロジェクトのページ
- C3の地図技術はWIREDの記事が詳しい