早く老人になりたい

2012年10月15日

第17回「ケータイの音声認識にシカゴハウスを聴かせる」

最近はじめてスマートフォンを買った

先日、私はそれまで5年ぐらい使っていたケータイ電話を新しいものに買い換えた。

「みんなiPhone持ってるから俺も欲しい」と、今までも何度かそんなことを考えたことがあったのだが、その都度、料金のことを考える面倒くささとか、手続きの面倒くささとか、そういう具体的なハードルを前に引き返してきた。

だが、今回はもともと使っていたケータイが壊れかけて、もうダメになりそうだったので、もう勢いをつけて買った。ドコモのGalaxyっていうやつ。

それで色々、今まで友達がいじってるのを横目で見ていただけの、スマホのタッチパネル特有の指でスーッとやる動きだの、便利な地図だの、アプリだのを使って日夜楽しんでいるのだが、ある時、長めのメールを作成しなくてはならない時に、マイクみたいなボタンを押したら、音声からメールを作成できることがふと、わかった。




すごいですね音声認識

ちなみに私は最近のスマートフォンの「音声認識機能」のすごさはすでに知っている。チミドロのMC「クスモ」が、スマートフォンを車のカーナビ代わりに使っていて、行き先の住所を声で入力するのを見ていた。最初は「えー。そんなのうまく入力できんの?」と横でバカにしていた私だったが、「ほらっ」と見せてもらうと本当に入力されている。自分でやってもウソのように、ちゃんと聞き取ってくれる。いつの間に機械ってこんなにレベル上げたの?昔はこういうのってたいていガッカリするような仕上がりだったと思うのだが…

あとあれ、iPhoneの「Siri」っていう機能のすごさも知っている。あれも、高度な音声認識技術がなきゃ始まらないものだろう。

なので、音声入力でメールを作成するっていうのも、かなり使えるに違いないと思ってやってみたのだが、これが本当に便利だった。そもそもスマートフォンの文字入力に慣れておらずモタモタしているのもあって、声で書いた方が断然早い。しかも聞き間違いはほぼゼロ。句読点とか、細かいところは手入力で直して、長文メールが簡単に作れた。

少し前までは自ら「スマート」などと名乗るスマートフォンを敵視していたが、なんて賢くて本当にスマートなんだろうか。




この機能を使って

音声入力が楽しくなった私は、こいつに色々聴かせてみたくなった。楽器の音を聴かせたらどうなるの?とか、遠い国の言語だったら、とか。例えば、キャスターがニュースを読み上げる声を聞かせたら、そのニュースの内容を簡単にテキスト化してメールできたりするんだろうか、など。

そんなわけでまず、PCのブラウザでYOUTUBEを立ち上げ、適当なニュース動画を再生。





普段、私はヘッドフォンでPCからの音声を聴いているのだが、そのボリュームを最大にして、耳に当たる部分をケータイのマイクがあるあたりに近づける。




1015_01.jpg
なんでも聞いてくれる



まず、この音声認識、あまり長い音声だと簡単に処理しきれないようで、勝手に入力を終了してしまい、しばらく考え中マークが出たのち




1015_02.jpg
簡単にはいかない



こんなエラーメッセージを出す。なぜ圏外だとダメなのかはよく分からないが、ここで使用しているドコモの音声認識機能は、利用に際して外部とのデータ通信が発生するらしく、また私の部屋の回線状況が非常に貧弱なのもあって、とにかくこのエラーが多発。

なので、できるだけ音声を短く区切って入力していった。音量の調整もなかなか難しく、




1015_03.jpg
音量の調整が難しい



という結果も出るが、くじけずやっていくと




1015_04.jpg
お!



1015_05.jpg
うまくいった!



と、上記のニュース動画でいう女性キャスターの「(エア)アジアジャパンは」っていう部分、航空券の価格を言っている部分をきちんと認識してくれた。




よし!ちゃんと認識してくれそうだ

さて次は、こんな音楽を聴かせてみよう。

ご存知ない方は、最初の15秒ぐらいまででいいので聴いてみてください。





「Pump It!」って言ってる声をサンプラーが連打しまくる、私がっていうか、こういう音楽が好きな人はみな愛してやまないDJ FUNKというトラックメイカーの1曲だが、さあ音声認識、これをどう聞く!




1015_06.jpg
なんだ急に



なんとなく「ポピポピ」とか「パパパパ」とか、そういう無意味なカタカナの羅列が表示されるかな?と予想していたのだが、大きく裏切られた。なんて慎ましいやつなんだ。いいんだよ!絵なんか下手な方が面白いよ!

しかしちょっとこれ、実際にはどこをどう聴いても「絵が下手で」には聴こえない。もう一度試してみると、




1015_07.jpg
そうかー。濡れなかったかー?



なんだこれ。というか、曲の冒頭の適当な部分を音声認識に聴かせてるからか、やる度に結果が違う。

もう一度やってみよう。




1015_08.jpg
はじめまして!キミ、かきへー君?





音楽と直接対話しているような気持ちだ

なんだか分からないが面白くて止まらなくなってきた。
例えば





この曲のドあたまの「D・J・FUNK!!」って叫んでるところ、これを音声認識に聴かせたらこうだ。




1015_09.jpg
ちっ!ちゃい!ぞ!

どこの世界に自曲の冒頭で自分がちっちゃいことを声高に宣言するヤツがいるのか。最高だ。

続くこちらも、先ほどから延々引用させていただいている「シカゴハウス」と称される音楽の中でも有名すぎる一曲だが、





冒頭の女性ボーカルのサンプルを聞かせてみたところ。




1015_10.jpg
そうかよ!



俺も楽しいよ!

せっかくなので、シカゴハウスにめちゃくちゃ造詣が深く、最近ではJUKE/FOOTWORKというシカゴ新しいサウンドを日本に紹介しているD.J.Kuroki Kouichi氏に曲選びを手伝ってもらった。こんなことに付き合っていただき、マジでありがとうございます!





冒頭のボイスサンプルを音声入力すると




1015_11.jpg
何か言おうとしてる



続けてこの曲の、やはり冒頭のボイスサンプルを聞かせると









1015_12.jpg
そうですか



もう従うしかない。誰がなんと言おうと「赤ちゃん」だ。





「It’s time for the perculator!(イッツタイムフォダパッキュレーター)」って何度も言ってる曲では




1015_13.jpg
一回ごとに



1015_14.jpg
結果が



1015_15.jpg
全然違う



もう、何が言いたいのかわからない錯乱ぶり。ちなみにマイクに向かって、このボイスサンプルを真似して叫んでみると、




1015_16.jpg
結構ニュアンスとらえてる



1015_17.jpg
イツカゴダト アッキレーター!



空耳アワーっぽい、あり得そうな聞き間違いになる。やはり、後ろのリズム音とか、途中から入ってくる「ピヨーン」みたいな音とかのせいで、こうも振り幅のでかい結果が生まれるのか。

さっきの「Pump It」も、自分で「パピパピ」って感じで発音してみると




1015_18.jpg
そうそう、こんな聞き間違いならあり得る



許容範囲な感じ。やはり、元曲を直接聞かせるとおかしな結果が出るようだ。




では最後に

とにかくまあ、やるたびに自由な言葉がつむぎ出されるわけだ。いわば自動筆記。これを使って、長めのメールを作ってみよう。音声認識に前述のDJ FUNK「Pump It」の冒頭部分を何度も聴かせて少しずつ文章を綴っていく。




1015_19.jpg



繰り返すが「パピパピ」言ってるだけの部分である。句読点は読みやすいように私の方で入れてみた。もうほとんど曲が勝手にしゃべってる状態。こいつはたしか「柿平」じゃなかったのか?「柿平」は「竹早時さん」で、こいつは「高畠」なのか。当たり前や!

さあ、このメールを友達に送信してみよう。あ、その前にメールのタイトルも音声認識で入力。同様に「Pump It」をまた音声入力してみると




1015_20.jpg



うんうん。これしかないというタイトルだ。そうだよ!おれは高畠だよ!

チミドロメンバーのMC「ミヤマッチ」に送ってみると




1015_21.jpg



同じくメンバーのシンセ担当「トミータ」に送ってみると




1015_22.jpg



「Pump It」が言おうとしていることはなかなか簡単には理解されないようだ。二人には、夜分遅くに不安になるようなメールをして本当にすまなかった。

今回は、当原稿の作成までにあまり時間がなく、音声入力に向いてそうな曲をじっくり探せなかった。音声認識機能のついたスマートフォンをお持ちの方、ぜひ、よかったらお気に入りの曲で片っ端から試してみて欲しい!そして気が向いたら結果を教えてください!お待ちしてます!




チミドロライブ情報

2012.10.19(金)
BLOX 30th ANNIVERSARY PARTY
中野heavysick ZERO

開場時間 / 23:00
当日料金 / 1,500円(1ドリンク)

LIVE /
 OPSB
 TEAM HIGH SOX(M×M×M)
 CHIMIDORO
 アンガス原田
 BUTTA BALLAS

DJ /
 TKO(BLOX)
 Doh(Shardon)
 otooto22(voxxxlab)
 へろう(Nagano)
 Jiro(T.F.T.D)
 NEW ARROW
 NICO(BLOX)



2012.10.20(土)
Maze
江古田noah

開催時間 / 22:00〜6:00 
当日料金 / 1,000円

DJ /
 HiBiKi MaMeShiBa
 Wardaa
 Alaskakarasu
 チミドロDJ's
 Quecy_
 Nothto

VJ /
 tenten



2012.10.21(日)
マカロニの穴の中
下北沢Daisy Bar

開場時間 / 18:00
当日料金 / 2,000円

出演 /
 ザ・マカロニクラブ
 ハニワニバイシクル
 AFRO
 Castr03
 チミドロ



2012.10.26(金)
渋谷区シカゴ三丁目
渋谷タマリバ

開催時間 / 19:00?23:00
当日料金 / 1,000円

出演 /
 D.J.April(Booty Tune)
 D.J.Kuroi Kouichi(Booty Tune)
 rioqmt(Footwork Dancer)
 チミドロ鈴木(缶ベキュー)



2012.10.27(土)
東京にもあったんだ!2012
渋谷womb

開場時間 / 13:00
前売料金 / 3,000円(ドリンク代別)
当日料金 / 3,500円(ドリンク代別)

出演 /
 A PAGE OF PUNK
 チミドロ
 CLASICKS
 COSMIC NEUROSE
 DAIEI SPRAY
 ELMO
 Essential
 フジロッ久(仮)
 #Gиgйz_(a.k.a GAGAKIRISE)
 GORO GOLO
 HARD CORE DUDE(大阪)
 JUICEBOXXX(USA)
 LAGITAGIDA
 Metrofield
 宮武BONES
 odd eyes(京都)
 office voids
 POWER EMPIRE(大阪)
 Tojin
 Tongues
 THIRTY JOY
 WEEKEND



posted by チミドロ鈴木 at 09:57| Comment(0) | 第1回〜第25回
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。