東京都市大学

研究者情報データベース

日本語 English

TOP
所属別検索
キーワード検索
研究分野別検索
条件指定検索

東京都市大学
ホームページ

岩野 公司 (イワノ コウジ,IWANO Koji)

基本情報 研究分野 研究業績 教育業績 社会貢献業績

 

書籍等出版物  
No.タイトル担当区分出版社出版年月担当範囲ISBN
1音声(下) 編者(編著者) コロナ社 2023年01月 9784339013672
2高精度化する個人認証技術 ~身体的、行動的認証からシステム開発、事例、国際標準化まで~ 共著 株式会社エヌ・ティー・エス 2014年11月 第2編第5章第5節 音声と顔/耳介画像を用いたマルチモーダル個人認証システムの開発 9784860434137
3DSP for In-Vehicle and Mobile Systems 分担執筆 Springer-Verlag 2005年01月 Chapter 9, pp.139-152, Noise Robust Speech Recognition Using Prosodic Information 0387229787
4Spoken Multimodal Human-Computer Dialogue in Mobile Environments 分担執筆 Springer-Verlag 2005年01月 Chapter 3, pp.37-53, A Robust Multimodal Speech Recognition Method Using Optical Flow Analysis 1402030738
5Text to Speech Synthesis - New Paradigms and Advances - 分担執筆 Prentice Hall PTR 2004年07月 Chapter 8, pp.155-173, Prosody Control for HMM-Based Japanese TTS 013145661X

 

論文  
No.論文タイトル誌名(出版物名)開始ページ終了ページ出版年月DOI査読の有無
1Multimodal Speech Recognition Using Mouth Images from Depth Camera Proc. APSIPA pp. 1233 1236 2017年12月 https://doi.org/10.1109/APSIPA.2017.82822271査読有り 
2アマチュアの身体表現にみる物理的特徴の分析 ―コスプレコミュニティの事例から― 情報文化学会誌 24 35 42 2017年09月  査読有り 
3Error correction using long context match for smartphone speech recognition IEICE Transactions on Information and Systems E98D 11 1932 1942 2015年11月01日 https://doi.org/10.1587/transinf.2015EDP71791査読有り 
4Error Correction Using Long Context Match for Smartphone Speech Recognition IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E98D 11 1932 1942 2015年11月 https://doi.org/10.1587/transinf.2015EDP71791査読有り 
5Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition 15TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2014), VOLS 1-4 1194 1198 2014年  査読有り 
6AN EFFICIENT ERROR CORRECTION INTERFACE FOR SPEECH RECOGNITION ON MOBILE TOUCHSCREEN DEVICES 2014 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY SLT 2014 454 459 2014年  査読有り 
7Feature normalization based on non-extensive statistics for speech recognition Speech Communication 55 587 599 2013年06月 https://doi.org/10.1016/j.specom.2013.02.0041査読有り 
8A noise-robust speech recognition approach incorporating normalized speech/non-speech likelihood into hypothesis scores SPEECH COMMUNICATION 55 377 386 2013年02月 https://doi.org/10.1016/j.specom.2012.10.0011査読有り 
9Detection of overlapped speech using lapel microphones in meeting Speech Communication 55 10 941 949 2013年 https://doi.org/10.1016/j.specom.2013.06.0131査読有り 
10Spectral subtraction based on non-extensive statistics for speech recognition IEICE Transactions on Information and Systems E96-D 1774 1782 2013年 https://doi.org/10.1587/transinf.E96.D.17741査読有り 
11Q-Gaussian based spectral subtraction for robust speech recognition 13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1254 1257 2012年  査読有り 
12Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity 13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1498 1501 2012年  査読有り 
13軽量な画像特徴量を用いたマルチモーダル音声認識 電子情報通信学会論文誌 Vol.J95-D No.3 618 627 2012年  査読有り 
14VAD-measure-embedded Decoder with Online Model Adaptation 11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 3122 2010年  査読有り 
15Optimization of On-the-Fly Composition for WFST-Based Speech Recognition Decoders The IEICE Transactions on Information and Systems Vol.J92-D No.7 1026 1035 2009年  査読無し 
16WFST 音声認識デコーダにおける on-the-fly 合成の最適化処理 電子情報通信学会論文誌 Vol.J92-D No.7 1026 1035 2009年  査読有り 
17Robust Speech Recognition Using VAD-measure-embedded Decoder INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 2203 2009年  査読有り 
18GENERALIZATION OF SPECIALIZED ON-THE-FLY COMPOSITION 2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS 4317 4320 2009年  査読有り 
19Differences between acoustic characteristics of spontaneous and read speech and their effects on speech recognition performance COMPUTER SPEECH AND LANGUAGE 22 171 184 2008年04月 https://doi.org/10.1016/j.csl.2007.07.0031査読有り 
20Evaluation of a noise-robust multi-stream speaker verification method using F(0) information IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E91D 549 557 2008年03月 https://doi.org/10.1093/ietisy/e9l-d.3.5491査読有り 
21Language Model Adaptation Using Machine-Translated Text for Resource-Deficient Languages EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING Vol.2008 Article ID 573832 7 pages 2008年 https://doi.org/10.1155/2008/5738321査読有り 
22Thai Broadcast News Corpus Construction and Evaluation SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008 1249 1254 2008年  査読有り 
23Implementation and Evaluation of Fast On-the-fly WFST Composition Algorithms INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 2110 2113 2008年  査読有り 
24Combining Gaussian mixture model with Global Variance term to improve the quality of an HMM-based polyglot speech synthesizer 2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3 1241 2007年  査読有り 
25Audio-Visual Speech Recognition Using Lip Information Extracted from Side-Face Images EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING Vol.2007 Article ID 64506 9 pages 2007年 https://doi.org/10.1155/2007/645061査読有り 
26The effect of spectral space reduction in spontaneous speech on recognition performances 2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3 473 2007年  査読有り 
27Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4 89 92 2007年  査読有り 
28音声情報を統合したプレゼンテーションコンテンツ検索 電子情報通信学会論文誌 Vol.J90-D No.2 209 222 2007年  査読無し 
29Presentation-Content Retrieval Integrated with the Speech Information IEICE Transactions on Information and Systems Vol.J90-D No.2 209 222 2007年  査読無し 
30New approach to the polyglot speech generation by means of an HMM-based speaker adaptable synthesizer SPEECH COMMUNICATION 48 10 1227 1242 2006年10月 https://doi.org/10.1016/j.specom.2006.05.0031査読有り 
31Sentence-extractive automatic speech summarization and evaluation techniques SPEECH COMMUNICATION 48 1151 1161 2006年09月 https://doi.org/10.1016/j.specom.2006.04.0051査読有り 
32A Weight Estimation Method Using LDA for Multi-Band Speech Recognition INTERSPEECH 2006 AND 9TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, VOLS 1-5 2534 2537 2006年  査読有り 
33A stream-weight and threshold estimation method using Adaboost for multi-stream speaker verification 2006 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL V, PROCEEDINGS 1081 2006年  査読有り 
34A stream-weight and threshold estimation method using adaboost for multi-stream speaker verification 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, Vols 1-13 5939 5942 2006年  査読有り 
35Analysis and recognition of spontaneous speech using Corpus of Spontaneous Japanese SPEECH COMMUNICATION 47 1-2 208 219 2005年09月 https://doi.org/10.1016/j.specom.2005.02.0101査読有り 
36Sentence extraction-based presentation summarization techniques and evaluation metrics 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5 1065 1068 2005年  査読有り 
37A ROBUST MULTIMODAL SPEECH RECOGNITION METHOD USING OPTICAL FLOW ANALYSIS SPOKEN MULTIMODAL HUMAN-COMPUTER DIALOGUE IN MOBILE ENVIRONMENTS 28 37 53 2005年  査読有り 
38Why is the recognition of spontaneous speech so hard? TEXT, SPEECH AND DIALOGUE, PROCEEDINGS 3658 22 2005年  査読有り 
39A stream-weight optimization method for multi-stream HMMS based on likelihood value normalization 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5 469 472 2005年  査読有り 
40Polyglot synthesis using a mixture of monolingual corpora ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings I1 I4 2005年 https://doi.org/10.1109/ICASSP.2005.14150351査読有り 
41Noise robust speech recognition using F-0 contour information IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E87D 1102 1109 2004年05月  査読有り 
42Multi-modal speech recognition using optical-flow analysis for lip images JOURNAL OF VLSI SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY 36 2-3 117 124 2004年02月  査読有り 
43A stream-weight optimization method for audio-visual speech recognition using multi-stream HMMS 2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS 857 860 2004年  査読有り 
44Unsupervised class-based language model adaptation for spontaneous speech recognition 2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS 236 239 2003年  査読有り 
45Parallel computing-based architecture for mixed-initiative spoken dialogue FOURTH IEEE INTERNATIONAL CONFERENCE ON MULTIMODAL INTERFACES, PROCEEDINGS 53 58 2002年  査読有り 
46Ubiquitous speech processing 2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I-VI, PROCEEDINGS 13 16 2001年  査読有り 
47Integration of Prosodic Word Boundary Detection to Unlimited-Vocabulary Speech Recognition IEICE Transactions on Information and Systems Vol.J83-D-II No.10 1977 1985 2000年  査読無し 
48Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings 1763 1766 2000年 https://doi.org/10.1109/ICASSP.2000.8620941査読有り 
49語彙制約なし音声認識へのアクセント句境界検出の統合 電子情報通信学会論文誌 Vol.J83-D-II No.10 1977 1985 2000年  査読有り 
50モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出 情報処理学会論文誌 Vol.40 No.4 1356 1364 1999年  査読有り 
51A Statistical Modeling of Fundamental Frequency Contours in Moraic Unit and Its Use for the Detection of Prosodic Word Boundaries IPSJ Journal Vol.40 No.4 1356 1364 1999年  査読無し 

 

MISC  
No.MISCタイトル誌名開始ページ終了ページ出版年月(日)
1「東京都市大学 科学体験教室」における科学コミュニケーション 東京都市大学横浜キャンパス情報メディアジャーナル 19 48 49 2018年04月 
2複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」) 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 189 53 58 2016年08月24日 
3声真似が話者照合に与える影響と物真似音声の音響特徴の分析 (音声) 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 411 43 48 2015年01月22日 
4Error Correction Using Long Context Match for Smartphone Speech Recognition (音声) -- (第16回音声言語シンポジウム) 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 365 117 122 2014年12月15日 
5Error Correction Using Long Context Match for Smartphone Speech Recognition 研究報告音声言語情報処理(SLP) 2014 22 2014年12月08日 
6口唇の深度画像を用いたマルチモーダル音声認識 研究報告音声言語情報処理(SLP) 2014 2014年07月17日 
7複数ピンマイクで収音された会議音声の重畳区間検出 研究報告音声言語情報処理(SLP) 2012 2012年07月12日 
8Two-pass Approach for Recognizing Code-Switching Speech (パターン認識・メディア理解) 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 111 430 225 229 2012年02月02日 
9Nonlinear normalization using q-logarithm for robust speech recognition (音声) 電子情報通信学会技術研究報告. SP, 音声 111 153 45 50 2011年07月14日 
10音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 電子情報通信学会技術研究報告. SP, 音声 110 81 49 54 2010年06月10日 
11HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討 研究報告音声言語情報処理(SLP) 2010 12 2010年02月05日 
12ウェアラブルコンピュータ環境における話者照合 東京都市大学環境情報学部紀要 11 80 87 2010年02月 
13F_0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討 電子情報通信学会技術研究報告. SP, 音声 109 99 87 92 2009年06月17日 
14話し言葉音声合成の韻律制御に関する検討 研究報告音声言語情報処理(SLP) 2009 23 2009年05月14日 
15耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化 電子情報通信学会技術研究報告. SP, 音声 108 422 19 24 2009年01月22日 
16マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討 情報処理学会研究報告 2009-NL-191, 2009-SLP-76 24 2009年 
17WFST音声認識デコーダの高機能化とその応用-on-the-fly合成法の検討- 情報処理学会研究報告音声言語情報処理(SLP) 2008 102 29 34 2008年10月17日 
18Accent analysis for Mandarin large vocabulary continuous speech recognition 聴覚研究会資料 38 123 127 2008年03月20日 
19Accent analysis for Mandarin large vocabulary continuous speech recognition (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology") 電子情報通信学会技術研究報告. SP, 音声 107 551 87 91 2008年03月13日 
20Initial evaluation of the drivers' Japanese speech corpus in a car environment (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology") 電子情報通信学会技術研究報告. SP, 音声 107 551 93 98 2008年03月13日 
21マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討 電子情報通信学会技術研究報告. SP, 音声 107 406 43 47 2007年12月13日 
22対話システムへの利用を想定したマルチモーダル音声認識の検討 電子情報通信学会技術研究報告. SP, 音声 107 77 19 24 2007年05月24日 
23HMMを用いた話し言葉音声合成のためのモデルの検討 電子情報通信学会技術研究報告. SP, 音声 107 77 13 18 2007年05月24日 
24講義音声認識における講義スライド情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 2006 136 221 226 2006年12月22日 
25講義音声認識における講義スライド情報の利用 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 106 442 43 48 2006年12月15日 
26マルチバンド音声認識のためのLDAに基づく帯域重み推定手法 電子情報通信学会技術研究報告. SP, 音声 106 78 13 18 2006年05月19日 
27話し言葉音声の音響的・言語的特徴の分析 電子情報通信学会技術研究報告. SP, 音声 106 78 19 24 2006年05月19日 
28HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 105 494 127 132 2005年12月22日 
29超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 105 494 2005年12月22日 
30HMM-based speaker adaptable polyglot synthesizer - Development and evaluation 窶骭 情報処理学会研究報告音声言語情報処理(SLP) 2005 127 217 222 2005年12月22日 
31超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討 情報処理学会研究報告音声言語情報処理(SLP) 2005 127 91 96 2005年12月22日 
32マルチストリーム話者照合におけるブースティングに基づく閥値最適化法の検討 情報処理学会研究報告音声言語情報処理(SLP) 2005 127 2005年12月21日 
33マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討 電子情報通信学会技術研究報告. SP, 音声 105 495 2005年12月21日 
34重要文抽出による音声自動要約手法とその客観評価法についての検討(要約, 検索, 認識・理解・対話・一般) 電子情報通信学会技術研究報告. SP, 音声 105 132 2005年06月16日 
35機械翻訳データを用いた音声認識のための言語モデル適応(多言語, CSJ, 認識・理解・対話・一般) 電子情報通信学会技術研究報告. SP, 音声 105 132 19 23 2005年06月16日 
36HMMを用いた話し言葉音声合成の実現に向けての検討(一般, 一般, チュートリアルレクチャー) 電子情報通信学会技術研究報告. SP, 音声 105 98 25 30 2005年05月20日 
37客観尺度を用いた音声自動要約手法の評価 日本音響学会研究発表会講演論文集 2005 2005年03月08日 
38マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析 日本音響学会研究発表会講演論文集 2005 231 232 2005年03月08日 
39多言語HMM音声合成における言語の追加 日本音響学会研究発表会講演論文集 2005 197 198 2005年03月08日 
40講演音声のインデキシングを目的としたセグメンテーション手法の検討 日本音響学会研究発表会講演論文集 2005 2005年03月08日 
41実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法 情報処理学会研究報告音声言語情報処理(SLP) 2005 12 29 34 2005年02月04日 
42マルチストリーム話者照合における ブースティングに基づく重み最適化法の検討 情報処理学会研究報告音声言語情報処理(SLP) 2004 131 175 180 2004年12月21日 
43マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 104 539 85 90 2004年12月21日 
44日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析 情報処理学会研究報告音声言語情報処理(SLP) 2004 103 12 2004年10月22日 
45雑音に頑健な話者照合のための基本周波数情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 2004 57 31 36 2004年05月28日 
46雑音に頑健な話者照合のための基本周波数情報の利用 電子情報通信学会技術研究報告. SP, 音声 104 87 2004年05月21日 
47マルチモーダル音声認識におけるストリーム重み係数最適化の検討 情報処理学会研究報告音声言語情報処理(SLP) 2003 124 241 246 2003年12月18日 
48周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識 情報処理学会研究報告音声言語情報処理(SLP) 2003 124 19 24 2003年12月18日 
49マルチモーダル音声認識におけるストリーム重み係数最適化の検討 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 103 517 241 246 2003年12月11日 
50周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 103 517 19 24 2003年12月11日 
51音声と耳介画像を用いたマルチモーダル個人認証 電子情報通信学会技術研究報告. SP, 音声 103 94 25 30 2003年05月30日 
52雑音に頑健な音声認識のための韻律情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 2003 58 55 60 2003年05月27日 
53横顔の動画像情報を用いたマルチモーダル音声認識 情報処理学会研究報告音声言語情報処理(SLP) 2003 58 61 66 2003年05月27日 
54音声自動要約を利用した講演速聞きシステムの検討 情報処理学会研究報告自然言語処理(NL) 2003 57 83 88 2003年05月26日 
55HMM音声合成における残差駆動による自然性向上の検討 日本音響学会研究発表会講演論文集 2003 241 242 2003年03月18日 
56マルチモーダル音声認識のための画像特徴量の改善 日本音響学会研究発表会講演論文集 2003 195 196 2003年03月18日 
57音声と顔画像を用いたマルチモーダル話者照合 日本音響学会研究発表会講演論文集 2003 107 108 2003年03月18日 
58音声と耳介画像を用いたマルチモーダル話者照合 日本音響学会研究発表会講演論文集 2003 109 110 2003年03月18日 
59言語モデルの教師なしバッチ型話題適応 日本音響学会研究発表会講演論文集 2003 129 130 2003年03月18日 
60言語モデルのバッチ型教師なし適応化法 情報処理学会研究報告音声言語情報処理(SLP) 2002 121 183 188 2002年12月16日 
61言語モデルのバッチ型教師なし適応化法 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 102 528 19 24 2002年12月13日 
62並列処理型計算機を用いた音声対話システムの検討 (テーマ:一般) 言語・音声理解と対話処理研究会 35 21 26 2002年06月07日 
63雑音に頑健な基本周波数抽出法とその音声認識への適用 電子情報通信学会技術研究報告. EA, 応用音響 102 33 37 42 2002年04月19日 
64実環境におけるマルチモーダル音声認識の評価 日本音響学会研究発表会講演論文集 2002 151 152 2002年03月18日 
65逐次話者適応を用いた並列処理型会議音声認識システムの検討 日本音響学会研究発表会講演論文集 2002 105 106 2002年03月18日 
66オプティカルフローを用いたマルチモーダル音声認識法の提案と評価 情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 2002 10 33 38 2002年02月01日 
67HMMに基づく音声合成における様々な発話速度の実現 信学技報 2002年 
68ハフ変換による雑音に頑健な基本周波数抽出法 情報処理学会研究報告音声言語情報処理(SLP) 2001 100 14 2001年10月19日 
69数量化I類によるF0パターン生成の制御要因に関する検討 情報処理学会研究報告音声言語情報処理(SLP) 2001 100 15 20 2001年10月19日 
70ハフ変換を用いた雑音中の音声からの基本周波数抽出法 日本音響学会研究発表会講演論文集 2001 209 210 2001年10月01日 
71数量化I類を用いたピッチパターン生成における制御要因の検討 日本音響学会研究発表会講演論文集 2001 221 222 2001年10月01日 
72オプティカルフローを用いたマルチモーダル音声認識の検討 日本音響学会研究発表会講演論文集 2001 27 28 2001年10月01日 
73並列処理型会議音声認識システムの検討 日本音響学会研究発表会講演論文集 2001 113 114 2001年10月01日 
74自由発話を対象とした対話システムの構築と評価 情報処理学会研究報告音声言語情報処理(SLP) 2001 55 79 86 2001年06月01日 
75語彙制約なし音声認識へのアクセント句境界情報の利用 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 99 524 73 78 1999年12月21日 
76語彙制約なし音声認識へのアクセント句境界情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 1999 108 205 210 1999年12月20日 
77句境界情報を利用した語彙制約のない姓名認識 日本音響学会研究発表会講演論文集 1999 151 152 1999年03月01日 
78モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用 情処研報 73 78 1999年 
79モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出 電子情報通信学会技術研究報告. SP, 音声 98 106 1998年06月12日 
80モーラ遷移確率モデルを用いたアクセント句の表現 日本音響学会研究発表会講演論文集 1998 153 154 1998年03月01日 
81モーラ遷移確率モデルによる統語境界検出の改良 日本音響学会研究発表会講演論文集 1997 133 134 1997年09月01日 
82モーラ遷移確率モデルを用いた統語境界の検出 電子情報通信学会技術研究報告. SP, 音声 97 114 33 40 1997年06月19日 
83HMMによる韻律パターン表現の一手法 音講論 341 342 1997年 

 

講演・口頭発表等  
No.講演・口頭発表タイトル会議名発表年月日主催者開催地
1マルチモーダル音声認識と話し言葉音声の分析 ― 古井研究室での研究の思い出 ― 情報処理学会 音声言語情報処理研究会 2023年01月26日 
2深層学習に基づく話者照合システムに対する物真似タレントと一般人による声真似攻撃の分析 第12回バイオメトリクスと認識・認証シンポジウム 2022年11月16日 
3画像処理技術を用いた部屋の片付き具合の自動推定 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション 2022年03月16日 
4話者照合システムに対する人間と声質変換の詐称攻撃力の比較 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション 2022年03月16日 
5x-vectorに基づく話者照合システムに対する一般人と物真似タレントによる声真似攻撃の分析 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション 2022年03月16日 
6Noise-Tolerant Time-Domain Speech Separation with Noise Bases Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2021年12月16日 
7隠れマルコフモデルを用いた楽曲の旋律と歌詞の自動対応推定 情報処理学会第83回全国大会 2021年03月18日 
8雑音の基底信号を用いた 耐雑音性の高い時間領域音声分離 電子情報通信学会 音声研究会 2021年03月03日 
9Team Takoyaki submission for VoxCeleb Speaker Recognition Challenge 2020 the VoxSRC Workshop 2020 2020年10月 
10実環境における自動撮影画像を対象とした畳み込みニューラルネットワークに基づく鳥類の出現検出と鳥種認識 映像情報メディア学会 メディア工学研究会 2020年02月08日 
11声質の類似性に基づく歌手マップの作成 情報処理学会全国大会講演論文集 2019年03月 
12写真スライドショー作成のための不要画像の自動検出 情報処理学会全国大会講演論文集 2019年03月 
13動作認識による実在確認機能を有するマルチモーダル個人認証システム 第8回バイオメトリクスと認識・認証シンポジウム 2018年11月 
14物真似タレントと素人による声真似攻撃が話者照合に与える影響の分析 第8回バイオメトリクスと認識・認証シンポジウム 2018年11月 
15Kinectを用いた実在確認機能を有するマルチモーダル個人認証システム 電子情報通信学会技術研究報告 2018年03月11日 
16深層ニューラルネットワークを用いたフォント変換 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション予稿集 2018年03月 
17Multimodal speech recognition using mouth images from depth camera Proceedings - 9th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017 2018年02月05日 
18ニューラルネットワークを利用した写真画像の自然物度の推定 電子情報通信学会技術研究報告 2017年09月28日 
19口唇深度画像を利用したディープオートエンコーダに基づくマルチモーダル音声認識 日本音響学会研究発表会講演論文集(CD-ROM) 2017年09月11日 
20プロの物真似タレントの声真似が話者照合に与える影響と音響特徴の分析 電子情報通信学会技術研究報告 2017年08月23日 
21口唇の深度画像を用いたディープオートエンコーダによるマルチモーダル音声認識 情報処理学会研究報告(Web) 2017年07月20日 
22日本語楽曲の旋律と歌詞のアクセントの関係分析のための自動対応付け 情報処理学会全国大会講演論文集 2017年03月16日 
23話者照合におけるプロの物真似タレントの声真似攻撃の影響の分析 情報処理学会全国大会講演論文集 2017年03月16日 
24話者認識と顔画像認識を用いた映像におけるマルチモーダル人物同定 日本音響学会研究発表会講演論文集(CD-ROM) 2017年03月01日 
25Analysis of Voice Imitation by Professional/Non-Professional Impersonators Based on Kullback–Leibler Divergence between Acoustic Models Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 2016年11月 
26複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 電子情報通信学会技術研究報告 2016年08月17日 
27演奏楽器の時間構造情報に基づく楽曲検索とDNNを用いた楽器演奏区間検出 情報処理学会研究報告(Web) 2016年05月14日 
28TokyoTech at MediaEval 2016 Multimodal Person Discovery in Broadcast TV task CEUR Workshop Proceedings 2016年01月01日 
29声真似が話者照合に与える影響と物真似音声の音響特徴の分析 電子情報通信学会 音声研究会 2015年 
30An Efficient Error Correction Interface for Speech Recognition on Mobile Touchscreen Devices 2014 IEEE Workshop on Spoken Language Technology, SLT 2014 - Proceedings 2014年04月01日 
31Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH 2014年01月01日 
32発声障がい者の会話支援を目的としたモーラ単位音声出力システムの開発と評価 第109回ヒューマンインタフェース学会研究会 2014年 
33An Efficient Error Correction Method for Smartphone Speech Recognition 日本音響学会 秋季研究発表会 2014年 
34Error Correction Using Long Context Match for Smartphone Speech Recognition 情報処理学会 音声言語情報処理研究会 2014年 
35話者照合への影響を考慮した模倣音声の音響分析 情報処理学会 全国大会 2014年 
36口唇の深度画像を用いたマルチモーダル音声認識 情報処理学会 音声言語情報処理研究会 2014年 
37複数スマートフォンで収録された多人数会話音声における対話グループ検出と話者決定 電子情報通信学会 音声研究会 2014年 
38モーラ単位音声出力を用いた発声障がい者のための会話支援システムの生成応答の評価 日本音響学会 春季研究発表会 2014年 
39複数スマートフォンで収録された多人数会話音声の話者決定 情報処理学会 全国大会 2014年 
40音声認識のためのqガウス分布を用いた音響モデル 日本音響学会 春季研究発表会 2013年 
41クラウド時代の音声情報処理 栢森情報科学振興財団 第13回Kフォーラム 2013年 
42モーラ単位音声出力を用いた発声障がい者のための会話支援システム 日本音響学会 秋季研究発表会 2013年 
43発声様態依存モデルを用いた話者認識 日本音響学会 春季研究発表会 2013年 
44音楽の調変化に対する相対的な色聴の分析 情報処理学会 全国大会 2013年 
45継続利用する話者照合システムにおける性能の経時変化に関する検討 情報処理学会 全国大会 2013年 
46Q-Gaussian Based Spectral Subtraction for Robust Speech Recognition 13th Annual Conference of the International Speech Communication Association 2012, INTERSPEECH 2012 2012年12月01日 
47A Compensation Technique Using q-Logarithm for Noisy Speech Recognition 日本音響学会 春季研究発表会 2012年 
48Recognition of Indonesian Code-Switching Speech 日本音響学会 春季研究発表会 2012年 
49Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity 2012年 
50クラウド時代の新しい音声研究パラダイム 情報処理学会 音声言語情報処理研究会 2012年 
51集団共有型ロボットにおける応答の差別化による親近感向上の検討 情報処理学会 全国大会 2012年 
52相互スペクトル減算と振幅スペクトル相関を用いた会議音声の重畳区間検出 日本音響学会 春季研究発表会 2012年 
53Spectral Subtraction Based on q-Gaussian Assumption for Noise Robust Speech Recognition 日本音響学会 春季研究発表会 2012年 
54複数ピンマイクで収音された会議音声の重畳区間検出 情報処理学会 音声言語情報処理研究会 2012年 
55Two-pass Approach for Recognizing Code-Switching Speech 電子情報通信学会 音声研究会 2012年 
56Nonlinear Normalization Using q-logarithm for Robust Speech Recognition 電子情報通信学会 音声研究会 2011年 
57自然性と個人性に優れた音声合成のための音素継続時間長適応法 日本音響学会 春季研究発表会 2010年 
58VAD の信頼度を利用した音声認識デコーダの検討 日本音響学会 秋季研究発表会 2010年 
59音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 電子情報通信学会 音声研究会 2010年 
60HMM 音声合成における自然性と個人性に優れた韻律モデル適応法の検討 情報処理学会 音声言語情報処理研究会 2010年 
61VAD-measure-embedded Decoder with Online Model Adaptation 2010年 
62An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis 2010年 
63自然性と個人性に優れたF0 パターン適応法 日本音響学会 秋季研究発表会 2009年 
64VAD の信頼度を利用した雑音に頑健な音声認識デコーダの検討 日本音響学会 秋季研究発表会 2009年 
65Development of a WFST based Speech Recognition System for a Resource Deficient Language Using Machine Translation 2009年 
66Noise Robust Speech Recognition Using Spectral Subtraction and F0 Information Extracted by Hough Transform 2009年 
67立体的音像定位を利用した音声合成システムの検討 日本音響学会 春季研究発表会 2009年 
68Robust Speech Recognition Using VAD-Measure-Embedded Decoder 2009年 
69ハフ変換による基本周波数情報を用いた耐雑音音声認識の高性能化の検討 日本音響学会 春季研究発表会 2009年 
70マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討 情報処理学会 音声言語情報処理研究会 2009年 
71話し言葉音声合成の韻律制御に関する検討 情報処理学会 音声言語情報処理研究会 2009年 
72F0パターン生成モデルのための数量化Ⅰ類の平均値置換による話者適応法の検討 電子情報通信学会 音声研究会 2009年 
73Recent Development of WFST-Based Speech Recognition Decoder 2009年 
74Generalization of Specialized On-the-fly Composition 2009年 
75耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化 電子情報通信学会 音声研究会 2009年 
76マルチモーダル音声対話システムのための音響・画像重みの推定手法の検討 日本音響学会 春季研究発表会 2009年 
77Thai Broadcast News Corpus Construction and Evaluation 2008年 
78音声入力によるマウスの直接操作の検討 日本音響学会 秋季研究発表会 2008年 
79WFST-based Icelandic ASR Using Machine Translation 日本音響学会 秋季研究発表会 2008年 
80音響的な認識誤りフレームに対するケプストラム空間拡張の効果 日本音響学会 秋季研究発表会 2008年 
81WFST音声認識デコーダの省メモリ化に関する検討 日本音響学会 春季研究発表会 2008年 
82An Analysis of Accent Effects on Mandarin Large Vocabulary Continuous Speech Recognition 日本音響学会 春季研究発表会 2008年 
83Development of a Speech Recognition System for Icelandic Using Machine Translated Text 2008年 
84Accent Analysis for Mandarin Large Vocabulary Continuous Speech Recognition 2008年 
85Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment 2008年 
86WFST 音声認識デコーダの高機能化とその応用 ― on-the-fly 合成法の検討 ― 情報処理学会 音声言語情報処理研究会 2008年 
87話し言葉音声合成における韻律制御要因の有効性の評価 日本音響学会 秋季研究発表会 2008年 
88WFST デコーダにおける on-the-fly 合成の高速化に関する検討 日本音響学会 秋季研究発表会 2008年 
89スペクトルサブトラクションとハフ変換による基本周波数情報を用いた耐雑音音声認識 日本音響学会 秋季研究発表会 2008年 
90Analysis of Spectral Reduction and Its Effects on Speech Recognition Performance The First Nijmegen Speech Reduction Workshop: Disappearing Sounds 2008年 
91An Automatic Singing Voice Evaluation Method for Voice Training 日本音響学会 春季研究発表会 2008年 
92Development of a Thai Broadcast News Corpus and an LVCSR System 日本音響学会 春季研究発表会 2008年 
93Acoustic and Linguistic Characterization of Spontaneous Speech 2007年 
94Development of a Speech Recognition System Using Machine Translated Data 日本音響学会 秋季研究発表会 2007年 
95話者照合における雑音に非依存なマルチストリーム重みの検討 日本音響学会 秋季研究発表会 2007年 
96Development of a Speech Recognition System Using a Sparse Training Corpus 2007年 
97Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition 2007年 
98The Effect of Spectral Space Reduction in Spontaneous Speech on Recognition Performances 2007年 
99Combining Gaussian Mixture Model with Global Variance Term to Improve the Quality of an HMM-Based Polyglot Speech Synthesizer 2007年 
100話し言葉音声の認識精度向上のために 人工知能学会 AIチャレンジ研究会 2007年 
101HMM を用いた話し言葉音声合成のためのモデルの検討 電子情報通信学会 音声研究会 2007年 
102HMM を用いた話し言葉音声合成におけるモデルの構築とその合成音声への影響 日本音響学会 春季研究発表会 2007年 
103対話音声を対象とした不特定話者マルチモーダル音声認識の検討 日本音響学会 春季研究発表会 2007年 
104スライド資料を用いた講義音声認識のための言語モデル適応 日本音響学会 春季研究発表会 2007年 
105話者照合におけるマルチストリーム重みの教師なし推定法の検討 日本音響学会 春季研究発表会 2007年 
106Development of an Indonesian Large Vocabulary Continuous Speech Recognition System 日本音響学会 秋季研究発表会 2006年 
107話し言葉音声の音響的・言語的特徴の分析 電子情報通信学会 音声研究会 2006年 
108Development of a Dialogue System for Web Retrieval 日本音響学会 春季研究発表会 2006年 
109野球中継番組を対象とした音響情報を用いたシーン認識 日本音響学会 春季研究発表会 2006年 
110Acoustic and Linguistic Characterization of Spontaneous Speech 2006年 
111Progress on a Speaker Adaptable Polyglot Synthesizer 2006年 
112A Stream-Weight and Threshold Estimation Method Using Adaboost for Multi-Stream Speaker Verification 2006年 
113A Large Vocabulary Continuous Speech Recognition System for Indonesian Language 2006年 
114A Weight Estimation Method Using LDA for Multi-Band Speech Recognition 2006年 
115New Approach to Polyglot Synthesis: How to Speak Any Language with Anyone's Voice 2006年 
116Why is Automatic Recognition of Spontaneous Speech So Difficult? 2006年 
117講義音声認識における講義スライド情報の利用 電子情報通信学会 音声研究会 2006年 
118Toward Hidden Markov Model-Based Spontaneous Speech Synthesis Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 2006年 
119Clustering Strategies for Hidden Markov Model-Based Polyglot Synthesis Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 2006年 
120話し言葉音声における音素の静的特徴量の分散と動的特徴量に関する分析 日本音響学会 秋季研究発表会 2006年 
121マルチバンド音声認識のための LDA に基づく帯域重み推定手法 電子情報通信学会 音声研究会 2006年 
122プレゼンテーション蓄積検索システムにおける講義・講演音声情報を利用した適合度の改善 電子情報通信学会 データ工学ワークショップ 2006年 
123Toward Robust Multimodal Speech Recognition 2005年 
124Why Is the Recognition of Spontaneous Speech so Hard? 2005年 
125Sentence Extraction-Based Presentation Summarization Techniques and Evaluation Metrics 2005年 
126Sentence Extraction-Based Automatic Speech Summarization and Evaluation Techniques 2005年 
127Speaker Adaptable Multilingual Synthesis 2005年 
128Polyglot Synthesis Using a Mixture of Monolingual Corpora 2005年 
129A Stream-Weight Optimization Method for Multi-Stream HMMs Based on Likelihood Value Normalization 2005年 
130マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討 電子情報通信学会 音声研究会 2005年 
131超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討 電子情報通信学会 音声研究会 2005年 
132HMM-Based Speaker Adaptable Polyglot Synthesizer – Development and Evaluation – 電子情報通信学会 音声研究会 2005年 
133超並列デコーダと逐次適応を用いた音声対話システム 日本音響学会 秋季研究発表会 2005年 
134Improvement of Language Model Adaptation Using Machine-Translated Text 日本音響学会 秋季研究発表会 2005年 
135マルチバンド音声認識における尤度重み推定法の検討 日本音響学会 秋季研究発表会 2005年 
136マルチストリーム話者照合におけるブースティングを用いた閾値の最適化 日本音響学会 秋季研究発表会 2005年 
137読み上げ音声に対する話し言葉音声の言語的特徴の分析 日本音響学会 秋季研究発表会 2005年 
138New Approach to Cross-Language Synthesis 日本音響学会 秋季研究発表会 2005年 
139重要文抽出による音声自動要約手法とその客観評価法についての検討 電子情報通信学会 音声研究会 2005年 
140Language Model Adaptation for ASR Using Machine-Translated Data 電子情報通信学会 音声研究会 2005年 
141HMM を用いた話し言葉音声合成の実現に向けての検討 電子情報通信学会 音声研究会 2005年 
142客観尺度を用いた音声自動要約手法の評価 日本音響学会 春季研究発表会 2005年 
143講演音声のインデキシングを目的としたセグメンテーション手法の検討 日本音響学会 春季研究発表会 2005年 
144Addition of New Languages to a Polyglot HMM-Based Synthesizer 日本音響学会 春季研究発表会 2005年 
145マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析 日本音響学会 春季研究発表会 2005年 
146実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法 情報処理学会 音声言語情報処理研究会 2005年 
147HMM を用いた話し言葉音声合成に関する検討 日本音響学会 秋季研究発表会 2005年 
148Multimodal Speaker Verification Using Ear Image Features Extracted by PCA and ICA 2005年 
149Language Model Adaptation for Resource Deficient Language Using Translated Data 2005年 
150Cross-Language Synthesis with a Polyglot Synthesizer 2005年 
151Stream-Weight Optimization by LDA and Adaboost for Multi-Stream Speaker Verification 2005年 
152Cluster-Based Modeling for Ubiquitous Speech Recognition 2005年 
153Analysis of Spectral Space Reduction in Spontaneous Speech and Its Effects on Speech Recognition Performance 2005年 
154Noise-Robust Speech Recognition Using Multi-Band Spectral Features The Meeting of Acoustical Society of America 2004年 
155周波数帯域ごとの重みつき尤度を用いた音声認識の検討 日本音響学会 春季研究発表会 2004年 
156尤度比最大基準によるストリーム重み最適化を用いたマルチモーダル音声認識の性能評価 日本音響学会 春季研究発表会 2004年 
157ハフ変換による基本周波数情報を用いた雑音に頑健な話者照合 日本音響学会 春季研究発表会 2004年 
158HMM 音声合成を利用したキャラクタの形状特徴に応じた音声合成法 日本音響学会 春季研究発表会 2004年 
159重要文抽出と文圧縮による英語音声の自動要約 話し言葉の科学と工学ワークショップ 2004年 
160横顔画像から抽出した口唇角度情報を用いたマルチモーダル音声認識 日本音響学会 秋季研究発表会 2004年 
161VoIP 携帯端末を利用した音声認証技術の検証 日本人間工学学会 モバイル人間工学研究部会 シンポジウム「ケータイ・カーナビの利用性と人間工学」 2004年 
162マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討 電子情報通信学会 音声研究会 2004年 
163日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析 情報処理学会 音声言語情報処理研究会 2004年 
164Improvement of Audio-Visual Speech Recognition in Cars 2004年 
165講演音声を対象とした要約手法の評価に関する検討 日本音響学会 秋季研究発表会 2004年 
166A Stream-Weight Optimization Method for Audio-Visual Speech Recognition Using Multi-Stream HMMs 2004年 
167Audio-Visual Speech Recognition Using New Lip Features Extracted from Side-Face Images 2004年 
168Noise-Robust Speaker Verification Using F0 Features 2004年 
169話し言葉音声認識における学習データ量と認識性能の関係 日本音響学会 秋季研究発表会 2004年 
170音声と耳介画像情報を用いたマルチモーダル話者照合の高精度化 日本音響学会 秋季研究発表会 2004年 
171マルチストリーム話者照合のためのブースティングによる重み最適化 日本音響学会 秋季研究発表会 2004年 
172マルチストリーム HMM における重み係数決定法に関する検討 日本音響学会 秋季研究発表会 2004年 
173Toward an HMM-Based Polyglot Synthesizer 日本音響学会 秋季研究発表会 2004年 
174日本語話し言葉音声と読み上げ音声の音響的特徴の比較 日本音響学会 秋季研究発表会 2004年 
175雑音に頑健な話者照合のための基本周波数情報の利用 電子情報通信学会 音声研究会 2004年 
176重要文抽出と文圧縮による音声自動要約手法の英語音声への適用 日本音響学会 春季研究発表会 2004年 
177雑音に頑健な音声認識のための韻律情報の利用 情報処理学会 音声言語情報処理研究会 2003年 
178Unsupervised Class-Based Language Model Adaptation for Spontaneous Speech Recognition 2003年 
179Unsupervised Language Model Adaptation Using Word Classes for Spontaneous Speech Recognition 2003年 
180Noise Robust Speech Recognition Using Prosodic Information 2003年 
181Audio-Visual Speech Recognition Using Lip Movement Extracted from Side-Face Images 2003年 
182Audio-Visual Person Authentication Using Speech and Ear Images 2003年 
183言語モデルの教師なしバッチ型話題適応 日本音響学会 春季研究発表会 2003年 
184周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識 電子情報通信学会 音声研究会 2003年 
185マルチモーダル音声認識におけるストリーム重み係数最適化の検討 電子情報通信学会 音声研究会 2003年 
186パーソナルロボット向けの家庭内雑音に頑健な音声認識の検討 日本音響学会 秋季研究発表会 2003年 
187マルチモーダル音声認識における音響・画像特徴の融合法に関する検討 日本音響学会 秋季研究発表会 2003年 
188横顔画像の口唇情報を利用したマルチモーダル音声認識 日本音響学会 秋季研究発表会 2003年 
189音声と顔画像を用いたマルチモーダル話者照合 日本音響学会 春季研究発表会 2003年 
190マルチモーダル音声認識のための画像特徴量の改善 日本音響学会 春季研究発表会 2003年 
191HMM 音声合成における残差駆動による自然性向上の検討 日本音響学会 春季研究発表会 2003年 
192音声と耳介画像を用いたマルチモーダル話者照合 日本音響学会 春季研究発表会 2003年 
193韓国人の日本語発声に対する発音誤りの自動検出・評定法 日本音響学会 秋季研究発表会 2003年 
194重みつきスペクトル特徴量を用いた雑音に頑健な音声認識 日本音響学会 秋季研究発表会 2003年 
195音声自動要約を利用した講演速聞きシステムの検討 情報処理学会 音声言語情報処理研究会 2003年 
196音声と耳介画像を用いたマルチモーダル個人認証 電子情報通信学会 音声研究会 2003年 
197横顔の動画像情報を用いたマルチモーダル音声認識 情報処理学会 音声言語情報処理研究会 2003年 
198A Robust Multi-Modal Speech Recognition Method Using Optical-Flow Analysis 2002年 
199Noise Robust Speech Recognition Using F0 Contour Extracted by Hough Transform 2002年 
200Speech-Rate-Variable HMM-Based Japanese TTS System 2002年 
201Parallel Computing-Based Architecture for Mixed-Initiative Spoken Dialogue 2002年 
202HMM に基づく音声合成における様々な発話速度の実現 電子情報通信学会 音声研究会 2002年 
203オプティカルフローを用いたマルチモーダル音声認識法の提案と評価 情報処理学会 音声言語情報処理研究会 2002年 
204実環境におけるマルチモーダル音声認識の評価 日本音響学会 春季研究発表会 2002年 
205言語モデルのバッチ型教師なし適応化法 電子情報通信学会 音声研究会 2002年 
206ハフ変換による基本周波数情報を用いた雑音に頑健な音声認識 日本音響学会 秋季研究発表会 2002年 
207並列処理型計算機による混合主導型対話音声認識システムの構築 日本音響学会 秋季研究発表会 2002年 
208HMM 音声合成における数量化Ⅰ類を用いた発話速度制御法 日本音響学会 秋季研究発表会 2002年 
209並列処理型計算機を用いた音声対話システムの検討 人工知能学会 言語・音声理解と対話処理研究会 2002年 
210逐次話者適応を用いた並列処理型会議音声認識システムの検討 日本音響学会 春季研究発表会 2002年 
211雑音に頑健な基本周波数抽出法とその音声認識への適用 電子情報通信学会 音声研究会 2002年 
212並列処理型会議音声認識システムの検討 日本音響学会 秋季研究発表会 2001年 
213Bimodal Speech Recognition Using Lip Movement Measured by Optical-Flow Analysis 2001年 
214Ubiquitous Speech Processing 2001年 
215Continuous Speech Recognition of Japanese Using Prosodic Word Boundaries Detected by Mora Transition Modeling of Fundamental Frequency Contours 2001年 
216オプティカルフローを用いたマルチモーダル音声認識の検討 日本音響学会 秋季研究発表会 2001年 
217ハフ変換を用いた雑音中の音声からの基本周波数抽出法 日本音響学会 秋季研究発表会 2001年 
218数量化Ⅰ類を用いたピッチパターン生成における制御要因の検討 日本音響学会 秋季研究発表会 2001年 
219ハフ変換による雑音に頑健な基本周波数抽出法 情報処理学会 音声言語情報処理研究会 2001年 
220数量化Ⅰ類によるF0パターンの生成の制御要因に関する検討 情報処理学会 音声言語情報処理研究会 2001年 
221自由発話を対象とした対話システムの構築と評価 情報処理学会 音声言語情報処理研究会 2001年 
222Modeling and Generation of Accentual Phrase F0 Contours Based on Discrete HMMs Synchronized at Mora-unit Transitions 2000年 
223モーラ遷移 HMM に基づく F0 パターンのモデル化と生成 日本音響学会 春季研究発表会 2000年 
224Detection of Prosodic Word Boundaries by Statistical Modeling of Mora Transitions of Fundamental Frequency Contours and Its Use for Continuous Speech Recognition 2000年 
225Prosodic Word Boundary Detection Using Statistical Modeling of Moraic Fundamental Frequency Contours and Its Use for Continuous Speech Recognition 1999年 
226語彙制約なし音声認識へのアクセント句境界情報の利用 電子情報通信学会 音声研究会 1999年 
227タイプライタ型音声認識へのアクセント句境界情報の利用 日本音響学会 秋季研究発表会 1999年 
228句境界情報を利用した語彙制約のない姓名認識 日本音響学会 春季研究発表会 1999年 
229モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用 情報処理学会 音声言語情報処理研究会 1999年 
230Prosodic Word Boundary Detection Using Mora Transition Modeling of Fundamental Frequency Contours -Speaker Independent Experiments- 1999年 
231Speaker-Independent Detection of Prosodic Word Boundary Using Mora Transition Modeling of Fundamental Frequency Contours 1999年 
232モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出 電子情報通信学会 音声研究会 1998年 
233モーラ遷移確率モデルを用いたアクセント句の表現 日本音響学会 春季研究発表会 1998年 
234Accent Type Recognition and Syntactic Boundary Detection of Japanese Using Statistical Modeling of Moraic Transitions of Fundamental Frequency Contours 1998年 
235Representing Prosodic Words Using Statistical Models of Moraic Transition of Fundamental Frequency Contours of Japanese 1998年 
236モーラ遷移確率モデルを用いた句境界検出システムの語彙制約なし音声認識への応用 日本音響学会 秋季研究発表会 1998年 
237モーラ遷移確率モデルによる統語境界検出の改良 日本音響学会 秋季研究発表会 1997年 
238HMM による韻律パターン表現の一手法 日本音響学会 春季研究発表会 1997年 
239Detecting Phrase Boundaries by Low-Pass Filtering of Fundamental Frequency Contours 1997年 
240A Method of Representing Fundamental Frequency Contours of Japanese Using Statistical Models of Moraic Transition 1997年 
241モーラ遷移確率モデルを用いた統語境界の検出 電子情報通信学会 音声研究会 1997年 
242Use of Prosodic Features in Speech Recognition 1996年 
243Posterior Use of Prosodic Features to Aid Speech Recognition Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 1996年 

 

受賞  
No.受賞年月授与機関賞名(対象業績)タイトル
12022年11月 第12回バイオメトリクスと認識・認証シンポジウム 優秀発表賞 深層学習に基づく話者照合システムに対する物真似タレントと一般人による声真似攻撃の分析 
22018年11月 第8回バイオメトリクスと認識・認証シンポジウム 優秀発表賞 物真似タレントと素人による声真似攻撃が話者照合に与える影響の分析 
32017年06月 電子情報通信学会 情報・システムソサイエティ査読功労賞 

 

共同研究・競争的資金等の研究課題  
No.提供機関制度名課題名等資金種別研究期間
1独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(C) 声真似による成りすまし攻撃に対する話者照合の耐性向上に関する研究 競争的資金  2019年 - 2021年 
2独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(B) マルチエージェント深層学習による音声因子分解 競争的資金  2019年 - 2021年 
3独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(B) 深層学習によるマルチモーダル時系列データ認識基盤の構築 競争的資金  2016年 - 2018年 
4独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(B) Deep Generative Model とその因子分解による音声情報処理基盤 競争的資金  2013年 - 2015年 
5独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(C) 模倣音声による詐称攻撃に対して頑健な話者照合の研究 競争的資金  2013年 - 2015年 
6A Study on High-Performance Speaker Verification in Wearable Computing Environments 競争的資金  2009年 - 現在 
7栢森情報科学振興財団 栢森情報科学振興財団研究助成 ウェアラブルコンピュータ環境における高精度話者照合に関する研究 競争的資金  2008年 - 2010年 
8A Study on High-Performance Speech Recognition Decoder Based on Weighted Finite-State Transducers 競争的資金  2008年 - 現在 
9文部科学省 文部科学省科学研究補助金 若手研究(B) 公開鍵基盤(PKI)と話者照合技術の融合に関する研究 競争的資金  2005年 - 2007年 
10文部科学省 文部科学省科学研究補助金 若手研究(B) 音声と耳介画像を用いたマルチモーダル・バイオメトリック個人認証 競争的資金  2002年 - 2004年 
11日本学術振興会 科学研究費助成事業 遍在ウェアラブル計算環境における会議CSCWのための音声認識システムの研究  2000年 - 2002年