どういう仕組みなのか興味がわいたのであちこちのサイトから断片的な情報を集めてきてまとめると、どうやらSiriクライアントからの音声入力文字列をAppleのSiriサーバーに渡さずに横取りするためのサーバーのようである。以下はその想像図である。(図はクリックで拡大します)
プラグインをいろいろつけることで自分だけの独自機能をSiriクライアントを通じてキックすることができるようだ。プラグインはRubyで書くようである。
わかりやすいサンプルとしてはiTuneを制御するためのプラグインのソースが公開されていた。中を見てみると音声認識されて受け取った文字列を正規表現でマッチしてそれに応じた応答を生成しているようですな。本物のSiriも似たようなことをやっているのだろう。
このプラグインの先にAnswers Anywhereをくっつけても面白いかなと思った。Appleから早く公開SDKが出るといいのに…
0 件のコメント:
コメントを投稿