KOMEI SUGIURA

新着

rospeex

rospeex は日・英・中・韓に対応したクラウド型音声コミュニケーションツールキットです。 ROS(Robot Operating System)上で動作するので、音声認識・合成・対話処理機 能を容易にロボットに組み込み可能です。

API(Pythonまたは C++)を用いて10行程度で簡単な対話を実現できます。自然で親しみやすい音声の合成が可能な非モノローグ音声合成にも一部対応しています。

ダウンロードとインストールに関する詳しい情報は、rospeexウェブサイトをご覧ください。

pagetop

ROSを経由しない音声認識

Linux以外ではROSを使うことが難しいことから、他のOSで利用するための音声認 識単体のみサービスを公開しています。

  • 学術研究目的のみにお使いください。 商用目的に利用されたい場合は別途ご相談ください。
  • 動作は無保証です。自己責任でお使いくだ さい。

C++サンプルコード, Pythonサンプルコード

# -*- coding: utf-8 -*-
"""
Usage: python sample.py input.wav
"""
import sys
import base64
import json
import urllib2

# Cloud-based speech recognition URL
URL ='http://rospeex.ucri.jgn-x.jp/nauth_json/jsServices/VoiceTraSR'

def read_wavfile(filename):
    with open(filename,'rb') as rf:
        wav = rf.read()
    return wav

def post_to_recognizer(wav):
    buf = base64.b64encode(wav)
    json_data = { "method":"recognize",
                  "params":( "ja",
                             {"audio":buf, "audioType":"audio/x-wav", "voiceType":"*" } ) }
    json_obj = json.dumps(json_data)
    req = urllib2.Request(URL, json_obj)
    cont = urllib2.urlopen(req).read()
    return cont

def print_text(json_str):
    json_obj = json.loads(json_str)
    print json_obj['result'].encode('utf-8')

if __name__=='__main__':
    argv = sys.argv
    wav = read_wavfile(argv[1])
    recognition_result = post_to_recognizer(wav)
    print_text(recognition_result)

pagetop

アプリ

非モノローグ音声合成

サービスロボット向けのクラウド型音声合成をお試しサイトで利用できます。 研究者からのリクエストが一定以上あればコーパス提供を検討できるので、ぜひご連絡ください。

  • FirefoxかGoogle Chromeでお試しください。 IEとSafariでは合成できません。
  • 学術研究目的のみにお使いください。 商用目的に利用されたい場合は別途ご相談ください。 ロボット開発者向けに作ったので、ロボットに応用していただけると個人的に ありがたいです。
  • 動作は無保証です。自己責任でお使いくだ さい。
  • 使用した場合は以下の論文を引用して下さい。
    K. Sugiura, Y. Shiga, H. Kawai, T. Misu and C. Hori: "A Cloud Robotics Approach towards Dialogue-Oriented Robot Speech," Advanced Robotics, Vol. 29, Issue 7, pp. 449-456, 2015.

C++サンプルコード, Pythonサンプルコード

# -*- coding: utf-8 -*-
import sys
import string
import base64
import urllib2
import json
import wave

# service URL
tts_url ='http://rospeex.ucri.jgn-x.jp/nauth_json/jsServices/VoiceTraSS'

# main 
if __name__=='__main__':
	# command
	tts_command = { "method":"speak",
	"params":["1.1",
	{"language":"ja","text":"こんにちは","voiceType":"*","audioType":"audio/x-wav"}]}
 
	obj_command = json.dumps(tts_command)     # string to json object
	req = urllib2.Request(tts_url, obj_command)
	received = urllib2.urlopen(req).read()	  # get data from server
	
	# extract wav file 
	obj_received = json.loads(received)
	tmp = obj_received['result']['audio'] # extract result->audio
	speech = base64.decodestring(tmp.encode('utf-8'))

	f = open ("out.wav",'wb')
	f.write(speech)
	f.close

京のおすすめ

iPhone, iPod touch, iPadで使用できます。 2010年に構築した音声対話システム(京都観光案内)の、副産物的アプリを作りました。 研究で収集したデータを使った、観光スポット推薦アプリです。 2013/1/1時点で2万ダウンロードされています。 現在、京都が対象ですが、他のスポットや地域にも広げられれば、と考えています。 本アプリのデータベースや手法の活用に興味がある方は、ぜひご連絡ください。

[2013/03/13追記]
京都観光Navi(京都市観光局)に京のおすすめ のアルゴリズムが導入されました。

[2015/07/31追記]
京のおすすめの公開を終了しました。 今後は京都観光Naviをご利用 いただければ、と思います。

pagetop

ロボカップ

RoboCup 2011イスタンブール大会 ノイズデータベース

音声ファイルをダウンロードし、実験室で再生しながらロボットの音声認識性能 の評価を行ってください。 ロボカップ@ホームの騒音環境がシミュレートできます。

Who Is Who (1h42m, 188MB)
ダウンロード
Enhanced Who Is Who (1h44m, 192MB)
ダウンロード
Shopping Mall (0h28m, 52MB)
ダウンロード

RoboCup@Home 2015 GPSR sentence generator

2015年のロボカップ@ホームジャパンオープンで使わ れたテスト用スクリプトです。英語版と日本語版を含みます。 以下からダウンロード可能です。
https://github.com/komeisugiura/GPSRsentence_generator

RoboCup@Home 2011 General Purpose Service Robots文生成器(日本語版)

2011年のロボカップ@ホームジャパンオープンで使われたテスト用スクリプトです。 以下のような文を生成します。

  • キッチンテーブル まで行って、シーフードヌードルを把持して、フィールドから出て.
  • 前にいる人の名前を聞いてから、その人を追跡して、それから外に出て.
  • サイドテーブル まで行って、自己紹介して、それからその人に付いて行って.
ダウンロード

RoboCup@Home 2010 General Purpose Service Robots文生成器(英語版)

2010年のロボカップ@ホーム世界大会で使われたテスト用スクリプトです。 以下のような文を生成します。

  • Go to the back door, grasp the chips, and bring it to the armchair.
  • Go to the dining table, introduce yourself, and leave the apartment.
  • Find a person, bring the yoghurt from the closet, and leave the apartment.
ダウンロード
pagetop

ドライバ

Linux版BarrettHand用ソフトウェア

LinuxでBarrettHandを動かすためのソフトウェアです。

ダウンロード
pagetop