東京都市大学

研究者情報データベース

日本語 English

TOP
所属別検索
キーワード検索
研究分野別検索
条件指定検索

東京都市大学
ホームページ

岩野 公司 (イワノ コウジ,IWANO Koji)

基本情報 研究分野 研究業績 教育業績 社会貢献業績

 

書籍等出版物  
No.タイトル担当区分出版社出版年月担当範囲ISBN
1音声(下) 編者(編著者) コロナ社 2023年01月 9784339013672
2高精度化する個人認証技術 ~身体的、行動的認証からシステム開発、事例、国際標準化まで~ 共著 株式会社エヌ・ティー・エス 2014年11月 第2編第5章第5節 音声と顔/耳介画像を用いたマルチモーダル個人認証システムの開発 9784860434137
3Spoken Multimodal Human-Computer Dialogue in Mobile Environments 分担執筆 Springer-Verlag 2005年01月 Chapter 3, pp.37-53, A Robust Multimodal Speech Recognition Method Using Optical Flow Analysis 1402030738
4DSP for In-Vehicle and Mobile Systems 分担執筆 Springer-Verlag 2005年01月 Chapter 9, pp.139-152, Noise Robust Speech Recognition Using Prosodic Information 0387229787
5Text to Speech Synthesis - New Paradigms and Advances - 分担執筆 Prentice Hall PTR 2004年07月 Chapter 8, pp.155-173, Prosody Control for HMM-Based Japanese TTS 013145661X

 

論文  
No.論文タイトル誌名(出版物名)開始ページ終了ページ出版年月DOI査読の有無
1Multimodal Speech Recognition Using Mouth Images from Depth Camera Proc. APSIPA pp. 1233 1236 2017年12月 https://doi.org/10.1109/APSIPA.2017.82822271査読有り 
2アマチュアの身体表現にみる物理的特徴の分析 ―コスプレコミュニティの事例から― 情報文化学会誌 24 35 42 2017年09月  査読有り 
3Error correction using long context match for smartphone speech recognition IEICE Transactions on Information and Systems E98D 11 1932 1942 2015年11月01日 https://doi.org/10.1587/transinf.2015EDP71791査読有り 
4Error Correction Using Long Context Match for Smartphone Speech Recognition IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E98D 11 1932 1942 2015年11月 https://doi.org/10.1587/transinf.2015EDP71791査読有り 
5Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition 15TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2014), VOLS 1-4 1194 1198 2014年  査読有り 
6AN EFFICIENT ERROR CORRECTION INTERFACE FOR SPEECH RECOGNITION ON MOBILE TOUCHSCREEN DEVICES 2014 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY SLT 2014 454 459 2014年  査読有り 
7Feature normalization based on non-extensive statistics for speech recognition Speech Communication 55 587 599 2013年06月 https://doi.org/10.1016/j.specom.2013.02.0041査読有り 
8A noise-robust speech recognition approach incorporating normalized speech/non-speech likelihood into hypothesis scores SPEECH COMMUNICATION 55 377 386 2013年02月 https://doi.org/10.1016/j.specom.2012.10.0011査読有り 
9Detection of overlapped speech using lapel microphones in meeting Speech Communication 55 10 941 949 2013年 https://doi.org/10.1016/j.specom.2013.06.0131査読有り 
10Spectral subtraction based on non-extensive statistics for speech recognition IEICE Transactions on Information and Systems E96-D 1774 1782 2013年 https://doi.org/10.1587/transinf.E96.D.17741査読有り 
11Q-Gaussian based spectral subtraction for robust speech recognition 13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1254 1257 2012年  査読有り 
12Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity 13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 1498 1501 2012年  査読有り 
13軽量な画像特徴量を用いたマルチモーダル音声認識 電子情報通信学会論文誌 Vol.J95-D No.3 618 627 2012年  査読有り 
14VAD-measure-embedded Decoder with Online Model Adaptation 11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 3122 2010年  査読有り 
15Optimization of On-the-Fly Composition for WFST-Based Speech Recognition Decoders The IEICE Transactions on Information and Systems Vol.J92-D No.7 1026 1035 2009年  査読無し 
16WFST 音声認識デコーダにおける on-the-fly 合成の最適化処理 電子情報通信学会論文誌 Vol.J92-D No.7 1026 1035 2009年  査読有り 
17Robust Speech Recognition Using VAD-measure-embedded Decoder INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 2203 2009年  査読有り 
18GENERALIZATION OF SPECIALIZED ON-THE-FLY COMPOSITION 2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS 4317 4320 2009年  査読有り 
19Differences between acoustic characteristics of spontaneous and read speech and their effects on speech recognition performance COMPUTER SPEECH AND LANGUAGE 22 171 184 2008年04月 https://doi.org/10.1016/j.csl.2007.07.0031査読有り 
20Evaluation of a noise-robust multi-stream speaker verification method using F(0) information IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E91D 549 557 2008年03月 https://doi.org/10.1093/ietisy/e9l-d.3.5491査読有り 
21Language Model Adaptation Using Machine-Translated Text for Resource-Deficient Languages EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING Vol.2008 Article ID 573832 7 pages 2008年 https://doi.org/10.1155/2008/5738321査読有り 
22Thai Broadcast News Corpus Construction and Evaluation SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008 1249 1254 2008年  査読有り 
23Implementation and Evaluation of Fast On-the-fly WFST Composition Algorithms INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 2110 2113 2008年  査読有り 
24Combining Gaussian mixture model with Global Variance term to improve the quality of an HMM-based polyglot speech synthesizer 2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3 1241 2007年  査読有り 
25Audio-Visual Speech Recognition Using Lip Information Extracted from Side-Face Images EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING Vol.2007 Article ID 64506 9 pages 2007年 https://doi.org/10.1155/2007/645061査読有り 
26The effect of spectral space reduction in spontaneous speech on recognition performances 2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3 473 2007年  査読有り 
27Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4 89 92 2007年  査読有り 
28音声情報を統合したプレゼンテーションコンテンツ検索 電子情報通信学会論文誌 Vol.J90-D No.2 209 222 2007年  査読無し 
29Presentation-Content Retrieval Integrated with the Speech Information IEICE Transactions on Information and Systems Vol.J90-D No.2 209 222 2007年  査読無し 
30New approach to the polyglot speech generation by means of an HMM-based speaker adaptable synthesizer SPEECH COMMUNICATION 48 10 1227 1242 2006年10月 https://doi.org/10.1016/j.specom.2006.05.0031査読有り 
31Sentence-extractive automatic speech summarization and evaluation techniques SPEECH COMMUNICATION 48 1151 1161 2006年09月 https://doi.org/10.1016/j.specom.2006.04.0051査読有り 
32A Weight Estimation Method Using LDA for Multi-Band Speech Recognition INTERSPEECH 2006 AND 9TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, VOLS 1-5 2534 2537 2006年  査読有り 
33A stream-weight and threshold estimation method using Adaboost for multi-stream speaker verification 2006 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL V, PROCEEDINGS 1081 2006年  査読有り 
34A stream-weight and threshold estimation method using adaboost for multi-stream speaker verification 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, Vols 1-13 5939 5942 2006年  査読有り 
35Analysis and recognition of spontaneous speech using Corpus of Spontaneous Japanese SPEECH COMMUNICATION 47 1-2 208 219 2005年09月 https://doi.org/10.1016/j.specom.2005.02.0101査読有り 
36Sentence extraction-based presentation summarization techniques and evaluation metrics 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5 1065 1068 2005年  査読有り 
37A ROBUST MULTIMODAL SPEECH RECOGNITION METHOD USING OPTICAL FLOW ANALYSIS SPOKEN MULTIMODAL HUMAN-COMPUTER DIALOGUE IN MOBILE ENVIRONMENTS 28 37 53 2005年  査読有り 
38Why is the recognition of spontaneous speech so hard? TEXT, SPEECH AND DIALOGUE, PROCEEDINGS 3658 22 2005年  査読有り 
39A stream-weight optimization method for multi-stream HMMS based on likelihood value normalization 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5 469 472 2005年  査読有り 
40Polyglot synthesis using a mixture of monolingual corpora ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings I1 I4 2005年 https://doi.org/10.1109/ICASSP.2005.14150351査読有り 
41Noise robust speech recognition using F-0 contour information IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E87D 1102 1109 2004年05月  査読有り 
42Multi-modal speech recognition using optical-flow analysis for lip images JOURNAL OF VLSI SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY 36 2-3 117 124 2004年02月  査読有り 
43A stream-weight optimization method for audio-visual speech recognition using multi-stream HMMS 2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS 857 860 2004年  査読有り 
44Unsupervised class-based language model adaptation for spontaneous speech recognition 2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS 236 239 2003年  査読有り 
45Parallel computing-based architecture for mixed-initiative spoken dialogue FOURTH IEEE INTERNATIONAL CONFERENCE ON MULTIMODAL INTERFACES, PROCEEDINGS 53 58 2002年  査読有り 
46Ubiquitous speech processing 2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I-VI, PROCEEDINGS 13 16 2001年  査読有り 
47Integration of Prosodic Word Boundary Detection to Unlimited-Vocabulary Speech Recognition IEICE Transactions on Information and Systems Vol.J83-D-II No.10 1977 1985 2000年  査読無し 
48Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings 1763 1766 2000年 https://doi.org/10.1109/ICASSP.2000.8620941査読有り 
49語彙制約なし音声認識へのアクセント句境界検出の統合 電子情報通信学会論文誌 Vol.J83-D-II No.10 1977 1985 2000年  査読有り 
50モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出 情報処理学会論文誌 Vol.40 No.4 1356 1364 1999年  査読有り 
51A Statistical Modeling of Fundamental Frequency Contours in Moraic Unit and Its Use for the Detection of Prosodic Word Boundaries IPSJ Journal Vol.40 No.4 1356 1364 1999年  査読無し 

 

MISC  
No.MISCタイトル誌名開始ページ終了ページ出版年月(日)
1「東京都市大学 科学体験教室」における科学コミュニケーション 東京都市大学横浜キャンパス情報メディアジャーナル 19 48 49 2018年04月 
2複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」) 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 189 53 58 2016年08月24日 
3声真似が話者照合に与える影響と物真似音声の音響特徴の分析 (音声) 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 411 43 48 2015年01月22日 
4Error Correction Using Long Context Match for Smartphone Speech Recognition (音声) -- (第16回音声言語シンポジウム) 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114 365 117 122 2014年12月15日 
5Error Correction Using Long Context Match for Smartphone Speech Recognition 研究報告音声言語情報処理(SLP) 2014 22 2014年12月08日 
6口唇の深度画像を用いたマルチモーダル音声認識 研究報告音声言語情報処理(SLP) 2014 2014年07月17日 
7複数ピンマイクで収音された会議音声の重畳区間検出 研究報告音声言語情報処理(SLP) 2012 2012年07月12日 
8Two-pass Approach for Recognizing Code-Switching Speech (パターン認識・メディア理解) 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 111 430 225 229 2012年02月02日 
9Nonlinear normalization using q-logarithm for robust speech recognition (音声) 電子情報通信学会技術研究報告. SP, 音声 111 153 45 50 2011年07月14日 
10音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 電子情報通信学会技術研究報告. SP, 音声 110 81 49 54 2010年06月10日 
11HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討 研究報告音声言語情報処理(SLP) 2010 12 2010年02月05日 
12ウェアラブルコンピュータ環境における話者照合 東京都市大学環境情報学部紀要 11 80 87 2010年02月 
13F_0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討 電子情報通信学会技術研究報告. SP, 音声 109 99 87 92 2009年06月17日 
14話し言葉音声合成の韻律制御に関する検討 研究報告音声言語情報処理(SLP) 2009 23 2009年05月14日 
15耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化 電子情報通信学会技術研究報告. SP, 音声 108 422 19 24 2009年01月22日 
16マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討 情報処理学会研究報告 2009-NL-191, 2009-SLP-76 24 2009年 
17WFST音声認識デコーダの高機能化とその応用-on-the-fly合成法の検討- 情報処理学会研究報告音声言語情報処理(SLP) 2008 102 29 34 2008年10月17日 
18Accent analysis for Mandarin large vocabulary continuous speech recognition 聴覚研究会資料 38 123 127 2008年03月20日 
19Accent analysis for Mandarin large vocabulary continuous speech recognition (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology") 電子情報通信学会技術研究報告. SP, 音声 107 551 87 91 2008年03月13日 
20Initial evaluation of the drivers' Japanese speech corpus in a car environment (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology") 電子情報通信学会技術研究報告. SP, 音声 107 551 93 98 2008年03月13日 
21マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討 電子情報通信学会技術研究報告. SP, 音声 107 406 43 47 2007年12月13日 
22対話システムへの利用を想定したマルチモーダル音声認識の検討 電子情報通信学会技術研究報告. SP, 音声 107 77 19 24 2007年05月24日 
23HMMを用いた話し言葉音声合成のためのモデルの検討 電子情報通信学会技術研究報告. SP, 音声 107 77 13 18 2007年05月24日 
24講義音声認識における講義スライド情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 2006 136 221 226 2006年12月22日 
25講義音声認識における講義スライド情報の利用 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 106 442 43 48 2006年12月15日 
26マルチバンド音声認識のためのLDAに基づく帯域重み推定手法 電子情報通信学会技術研究報告. SP, 音声 106 78 13 18 2006年05月19日 
27話し言葉音声の音響的・言語的特徴の分析 電子情報通信学会技術研究報告. SP, 音声 106 78 19 24 2006年05月19日 
28HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 105 494 127 132 2005年12月22日 
29超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 105 494 2005年12月22日 
30HMM-based speaker adaptable polyglot synthesizer - Development and evaluation 窶骭 情報処理学会研究報告音声言語情報処理(SLP) 2005 127 217 222 2005年12月22日 
31超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討 情報処理学会研究報告音声言語情報処理(SLP) 2005 127 91 96 2005年12月22日 
32マルチストリーム話者照合におけるブースティングに基づく閥値最適化法の検討 情報処理学会研究報告音声言語情報処理(SLP) 2005 127 2005年12月21日 
33マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討 電子情報通信学会技術研究報告. SP, 音声 105 495 2005年12月21日 
34重要文抽出による音声自動要約手法とその客観評価法についての検討(要約, 検索, 認識・理解・対話・一般) 電子情報通信学会技術研究報告. SP, 音声 105 132 2005年06月16日 
35機械翻訳データを用いた音声認識のための言語モデル適応(多言語, CSJ, 認識・理解・対話・一般) 電子情報通信学会技術研究報告. SP, 音声 105 132 19 23 2005年06月16日 
36HMMを用いた話し言葉音声合成の実現に向けての検討(一般, 一般, チュートリアルレクチャー) 電子情報通信学会技術研究報告. SP, 音声 105 98 25 30 2005年05月20日 
37客観尺度を用いた音声自動要約手法の評価 日本音響学会研究発表会講演論文集 2005 2005年03月08日 
38マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析 日本音響学会研究発表会講演論文集 2005 231 232 2005年03月08日 
39多言語HMM音声合成における言語の追加 日本音響学会研究発表会講演論文集 2005 197 198 2005年03月08日 
40講演音声のインデキシングを目的としたセグメンテーション手法の検討 日本音響学会研究発表会講演論文集 2005 2005年03月08日 
41実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法 情報処理学会研究報告音声言語情報処理(SLP) 2005 12 29 34 2005年02月04日 
42マルチストリーム話者照合における ブースティングに基づく重み最適化法の検討 情報処理学会研究報告音声言語情報処理(SLP) 2004 131 175 180 2004年12月21日 
43マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 104 539 85 90 2004年12月21日 
44日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析 情報処理学会研究報告音声言語情報処理(SLP) 2004 103 12 2004年10月22日 
45雑音に頑健な話者照合のための基本周波数情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 2004 57 31 36 2004年05月28日 
46雑音に頑健な話者照合のための基本周波数情報の利用 電子情報通信学会技術研究報告. SP, 音声 104 87 2004年05月21日 
47マルチモーダル音声認識におけるストリーム重み係数最適化の検討 情報処理学会研究報告音声言語情報処理(SLP) 2003 124 241 246 2003年12月18日 
48周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識 情報処理学会研究報告音声言語情報処理(SLP) 2003 124 19 24 2003年12月18日 
49マルチモーダル音声認識におけるストリーム重み係数最適化の検討 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 103 517 241 246 2003年12月11日 
50周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 103 517 19 24 2003年12月11日 
51音声と耳介画像を用いたマルチモーダル個人認証 電子情報通信学会技術研究報告. SP, 音声 103 94 25 30 2003年05月30日 
52雑音に頑健な音声認識のための韻律情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 2003 58 55 60 2003年05月27日 
53横顔の動画像情報を用いたマルチモーダル音声認識 情報処理学会研究報告音声言語情報処理(SLP) 2003 58 61 66 2003年05月27日 
54音声自動要約を利用した講演速聞きシステムの検討 情報処理学会研究報告自然言語処理(NL) 2003 57 83 88 2003年05月26日 
55HMM音声合成における残差駆動による自然性向上の検討 日本音響学会研究発表会講演論文集 2003 241 242 2003年03月18日 
56マルチモーダル音声認識のための画像特徴量の改善 日本音響学会研究発表会講演論文集 2003 195 196 2003年03月18日 
57音声と顔画像を用いたマルチモーダル話者照合 日本音響学会研究発表会講演論文集 2003 107 108 2003年03月18日 
58音声と耳介画像を用いたマルチモーダル話者照合 日本音響学会研究発表会講演論文集 2003 109 110 2003年03月18日 
59言語モデルの教師なしバッチ型話題適応 日本音響学会研究発表会講演論文集 2003 129 130 2003年03月18日 
60言語モデルのバッチ型教師なし適応化法 情報処理学会研究報告音声言語情報処理(SLP) 2002 121 183 188 2002年12月16日 
61言語モデルのバッチ型教師なし適応化法 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 102 528 19 24 2002年12月13日 
62並列処理型計算機を用いた音声対話システムの検討 (テーマ:一般) 言語・音声理解と対話処理研究会 35 21 26 2002年06月07日 
63雑音に頑健な基本周波数抽出法とその音声認識への適用 電子情報通信学会技術研究報告. EA, 応用音響 102 33 37 42 2002年04月19日 
64実環境におけるマルチモーダル音声認識の評価 日本音響学会研究発表会講演論文集 2002 151 152 2002年03月18日 
65逐次話者適応を用いた並列処理型会議音声認識システムの検討 日本音響学会研究発表会講演論文集 2002 105 106 2002年03月18日 
66オプティカルフローを用いたマルチモーダル音声認識法の提案と評価 情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 2002 10 33 38 2002年02月01日 
67HMMに基づく音声合成における様々な発話速度の実現 信学技報 2002年 
68ハフ変換による雑音に頑健な基本周波数抽出法 情報処理学会研究報告音声言語情報処理(SLP) 2001 100 14 2001年10月19日 
69数量化I類によるF0パターン生成の制御要因に関する検討 情報処理学会研究報告音声言語情報処理(SLP) 2001 100 15 20 2001年10月19日 
70ハフ変換を用いた雑音中の音声からの基本周波数抽出法 日本音響学会研究発表会講演論文集 2001 209 210 2001年10月01日 
71数量化I類を用いたピッチパターン生成における制御要因の検討 日本音響学会研究発表会講演論文集 2001 221 222 2001年10月01日 
72オプティカルフローを用いたマルチモーダル音声認識の検討 日本音響学会研究発表会講演論文集 2001 27 28 2001年10月01日 
73並列処理型会議音声認識システムの検討 日本音響学会研究発表会講演論文集 2001 113 114 2001年10月01日 
74自由発話を対象とした対話システムの構築と評価 情報処理学会研究報告音声言語情報処理(SLP) 2001 55 79 86 2001年06月01日 
75語彙制約なし音声認識へのアクセント句境界情報の利用 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 99 524 73 78 1999年12月21日 
76語彙制約なし音声認識へのアクセント句境界情報の利用 情報処理学会研究報告音声言語情報処理(SLP) 1999 108 205 210 1999年12月20日 
77句境界情報を利用した語彙制約のない姓名認識 日本音響学会研究発表会講演論文集 1999 151 152 1999年03月01日 
78モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用 情処研報 73 78 1999年 
79モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出 電子情報通信学会技術研究報告. SP, 音声 98 106 1998年06月12日 
80モーラ遷移確率モデルを用いたアクセント句の表現 日本音響学会研究発表会講演論文集 1998 153 154 1998年03月01日 
81モーラ遷移確率モデルによる統語境界検出の改良 日本音響学会研究発表会講演論文集 1997 133 134 1997年09月01日 
82モーラ遷移確率モデルを用いた統語境界の検出 電子情報通信学会技術研究報告. SP, 音声 97 114 33 40 1997年06月19日 
83HMMによる韻律パターン表現の一手法 音講論 341 342 1997年 

 

講演・口頭発表等  
No.講演・口頭発表タイトル会議名発表年月日主催者開催地
1マルチモーダル音声認識と話し言葉音声の分析 ― 古井研究室での研究の思い出 ― 情報処理学会 音声言語情報処理研究会 2023年01月26日 
2深層学習に基づく話者照合システムに対する物真似タレントと一般人による声真似攻撃の分析 第12回バイオメトリクスと認識・認証シンポジウム 2022年11月16日 
3x-vectorに基づく話者照合システムに対する一般人と物真似タレントによる声真似攻撃の分析 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション 2022年03月16日 
4画像処理技術を用いた部屋の片付き具合の自動推定 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション 2022年03月16日 
5話者照合システムに対する人間と声質変換の詐称攻撃力の比較 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション 2022年03月16日 
6Noise-Tolerant Time-Domain Speech Separation with Noise Bases Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2021年12月16日 
7隠れマルコフモデルを用いた楽曲の旋律と歌詞の自動対応推定 情報処理学会第83回全国大会 2021年03月18日 
8雑音の基底信号を用いた 耐雑音性の高い時間領域音声分離 電子情報通信学会 音声研究会 2021年03月03日 
9Team Takoyaki submission for VoxCeleb Speaker Recognition Challenge 2020 the VoxSRC Workshop 2020 2020年10月 
10実環境における自動撮影画像を対象とした畳み込みニューラルネットワークに基づく鳥類の出現検出と鳥種認識 映像情報メディア学会 メディア工学研究会 2020年02月08日 
11写真スライドショー作成のための不要画像の自動検出 情報処理学会全国大会講演論文集 2019年03月 
12声質の類似性に基づく歌手マップの作成 情報処理学会全国大会講演論文集 2019年03月 
13物真似タレントと素人による声真似攻撃が話者照合に与える影響の分析 第8回バイオメトリクスと認識・認証シンポジウム 2018年11月 
14動作認識による実在確認機能を有するマルチモーダル個人認証システム 第8回バイオメトリクスと認識・認証シンポジウム 2018年11月 
15Kinectを用いた実在確認機能を有するマルチモーダル個人認証システム 電子情報通信学会技術研究報告 2018年03月11日 
16深層ニューラルネットワークを用いたフォント変換 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション予稿集 2018年03月 
17Multimodal speech recognition using mouth images from depth camera Proceedings - 9th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017 2018年02月05日 
18ニューラルネットワークを利用した写真画像の自然物度の推定 電子情報通信学会技術研究報告 2017年09月28日 
19口唇深度画像を利用したディープオートエンコーダに基づくマルチモーダル音声認識 日本音響学会研究発表会講演論文集(CD-ROM) 2017年09月11日 
20プロの物真似タレントの声真似が話者照合に与える影響と音響特徴の分析 電子情報通信学会技術研究報告 2017年08月23日 
21口唇の深度画像を用いたディープオートエンコーダによるマルチモーダル音声認識 情報処理学会研究報告(Web) 2017年07月20日 
22日本語楽曲の旋律と歌詞のアクセントの関係分析のための自動対応付け 情報処理学会全国大会講演論文集 2017年03月16日 
23話者照合におけるプロの物真似タレントの声真似攻撃の影響の分析 情報処理学会全国大会講演論文集 2017年03月16日 
24話者認識と顔画像認識を用いた映像におけるマルチモーダル人物同定 日本音響学会研究発表会講演論文集(CD-ROM) 2017年03月01日 
25Analysis of Voice Imitation by Professional/Non-Professional Impersonators Based on Kullback–Leibler Divergence between Acoustic Models Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 2016年11月 
26複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 電子情報通信学会技術研究報告 2016年08月17日 
27演奏楽器の時間構造情報に基づく楽曲検索とDNNを用いた楽器演奏区間検出 情報処理学会研究報告(Web) 2016年05月14日 
28TokyoTech at MediaEval 2016 Multimodal Person Discovery in Broadcast TV task CEUR Workshop Proceedings 2016年01月01日 
29声真似が話者照合に与える影響と物真似音声の音響特徴の分析 電子情報通信学会 音声研究会 2015年 
30An Efficient Error Correction Interface for Speech Recognition on Mobile Touchscreen Devices 2014 IEEE Workshop on Spoken Language Technology, SLT 2014 - Proceedings 2014年04月01日 
31Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH 2014年01月01日 
32An Efficient Error Correction Method for Smartphone Speech Recognition 日本音響学会 秋季研究発表会 2014年 
33複数スマートフォンで収録された多人数会話音声の話者決定 情報処理学会 全国大会 2014年 
34モーラ単位音声出力を用いた発声障がい者のための会話支援システムの生成応答の評価 日本音響学会 春季研究発表会 2014年 
35口唇の深度画像を用いたマルチモーダル音声認識 情報処理学会 音声言語情報処理研究会 2014年 
36複数スマートフォンで収録された多人数会話音声における対話グループ検出と話者決定 電子情報通信学会 音声研究会 2014年 
37話者照合への影響を考慮した模倣音声の音響分析 情報処理学会 全国大会 2014年 
38発声障がい者の会話支援を目的としたモーラ単位音声出力システムの開発と評価 第109回ヒューマンインタフェース学会研究会 2014年 
39Error Correction Using Long Context Match for Smartphone Speech Recognition 情報処理学会 音声言語情報処理研究会 2014年 
40クラウド時代の音声情報処理 栢森情報科学振興財団 第13回Kフォーラム 2013年 
41モーラ単位音声出力を用いた発声障がい者のための会話支援システム 日本音響学会 秋季研究発表会 2013年 
42音声認識のためのqガウス分布を用いた音響モデル 日本音響学会 春季研究発表会 2013年 
43継続利用する話者照合システムにおける性能の経時変化に関する検討 情報処理学会 全国大会 2013年 
44発声様態依存モデルを用いた話者認識 日本音響学会 春季研究発表会 2013年 
45音楽の調変化に対する相対的な色聴の分析 情報処理学会 全国大会 2013年 
46Q-Gaussian Based Spectral Subtraction for Robust Speech Recognition 13th Annual Conference of the International Speech Communication Association 2012, INTERSPEECH 2012 2012年12月01日 
47Spectral Subtraction Based on q-Gaussian Assumption for Noise Robust Speech Recognition 日本音響学会 春季研究発表会 2012年 
48Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity 2012年 
49クラウド時代の新しい音声研究パラダイム 情報処理学会 音声言語情報処理研究会 2012年 
50集団共有型ロボットにおける応答の差別化による親近感向上の検討 情報処理学会 全国大会 2012年 
51相互スペクトル減算と振幅スペクトル相関を用いた会議音声の重畳区間検出 日本音響学会 春季研究発表会 2012年 
52複数ピンマイクで収音された会議音声の重畳区間検出 情報処理学会 音声言語情報処理研究会 2012年 
53Two-pass Approach for Recognizing Code-Switching Speech 電子情報通信学会 音声研究会 2012年 
54Recognition of Indonesian Code-Switching Speech 日本音響学会 春季研究発表会 2012年 
55A Compensation Technique Using q-Logarithm for Noisy Speech Recognition 日本音響学会 春季研究発表会 2012年 
56Nonlinear Normalization Using q-logarithm for Robust Speech Recognition 電子情報通信学会 音声研究会 2011年 
57音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 電子情報通信学会 音声研究会 2010年 
58自然性と個人性に優れた音声合成のための音素継続時間長適応法 日本音響学会 春季研究発表会 2010年 
59An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis 2010年 
60VAD-measure-embedded Decoder with Online Model Adaptation 2010年 
61VAD の信頼度を利用した音声認識デコーダの検討 日本音響学会 秋季研究発表会 2010年 
62HMM 音声合成における自然性と個人性に優れた韻律モデル適応法の検討 情報処理学会 音声言語情報処理研究会 2010年 
63F0パターン生成モデルのための数量化Ⅰ類の平均値置換による話者適応法の検討 電子情報通信学会 音声研究会 2009年 
64Robust Speech Recognition Using VAD-Measure-Embedded Decoder 2009年 
65Noise Robust Speech Recognition Using Spectral Subtraction and F0 Information Extracted by Hough Transform 2009年 
66マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討 情報処理学会 音声言語情報処理研究会 2009年 
67Development of a WFST based Speech Recognition System for a Resource Deficient Language Using Machine Translation 2009年 
68話し言葉音声合成の韻律制御に関する検討 情報処理学会 音声言語情報処理研究会 2009年 
69Recent Development of WFST-Based Speech Recognition Decoder 2009年 
70立体的音像定位を利用した音声合成システムの検討 日本音響学会 春季研究発表会 2009年 
71自然性と個人性に優れたF0 パターン適応法 日本音響学会 秋季研究発表会 2009年 
72Generalization of Specialized On-the-fly Composition 2009年 
73ハフ変換による基本周波数情報を用いた耐雑音音声認識の高性能化の検討 日本音響学会 春季研究発表会 2009年 
74マルチモーダル音声対話システムのための音響・画像重みの推定手法の検討 日本音響学会 春季研究発表会 2009年 
75耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化 電子情報通信学会 音声研究会 2009年 
76VAD の信頼度を利用した雑音に頑健な音声認識デコーダの検討 日本音響学会 秋季研究発表会 2009年 
77スペクトルサブトラクションとハフ変換による基本周波数情報を用いた耐雑音音声認識 日本音響学会 秋季研究発表会 2008年 
78WFST音声認識デコーダの省メモリ化に関する検討 日本音響学会 春季研究発表会 2008年 
79Development of a Speech Recognition System for Icelandic Using Machine Translated Text 2008年 
80Accent Analysis for Mandarin Large Vocabulary Continuous Speech Recognition 2008年 
81Thai Broadcast News Corpus Construction and Evaluation 2008年 
82Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment 2008年 
83WFST 音声認識デコーダの高機能化とその応用 ― on-the-fly 合成法の検討 ― 情報処理学会 音声言語情報処理研究会 2008年 
84話し言葉音声合成における韻律制御要因の有効性の評価 日本音響学会 秋季研究発表会 2008年 
85WFST デコーダにおける on-the-fly 合成の高速化に関する検討 日本音響学会 秋季研究発表会 2008年 
86WFST-based Icelandic ASR Using Machine Translation 日本音響学会 秋季研究発表会 2008年 
87Analysis of Spectral Reduction and Its Effects on Speech Recognition Performance The First Nijmegen Speech Reduction Workshop: Disappearing Sounds 2008年 
88An Automatic Singing Voice Evaluation Method for Voice Training 日本音響学会 春季研究発表会 2008年 
89Development of a Thai Broadcast News Corpus and an LVCSR System 日本音響学会 春季研究発表会 2008年 
90An Analysis of Accent Effects on Mandarin Large Vocabulary Continuous Speech Recognition 日本音響学会 春季研究発表会 2008年 
91音声入力によるマウスの直接操作の検討 日本音響学会 秋季研究発表会 2008年 
92音響的な認識誤りフレームに対するケプストラム空間拡張の効果 日本音響学会 秋季研究発表会 2008年 
93話者照合における雑音に非依存なマルチストリーム重みの検討 日本音響学会 秋季研究発表会 2007年 
94話者照合におけるマルチストリーム重みの教師なし推定法の検討 日本音響学会 春季研究発表会 2007年 
95The Effect of Spectral Space Reduction in Spontaneous Speech on Recognition Performances 2007年 
96スライド資料を用いた講義音声認識のための言語モデル適応 日本音響学会 春季研究発表会 2007年 
97Combining Gaussian Mixture Model with Global Variance Term to Improve the Quality of an HMM-Based Polyglot Speech Synthesizer 2007年 
98対話音声を対象とした不特定話者マルチモーダル音声認識の検討 日本音響学会 春季研究発表会 2007年 
99HMM を用いた話し言葉音声合成におけるモデルの構築とその合成音声への影響 日本音響学会 春季研究発表会 2007年 
100話し言葉音声の認識精度向上のために 人工知能学会 AIチャレンジ研究会 2007年 
101HMM を用いた話し言葉音声合成のためのモデルの検討 電子情報通信学会 音声研究会 2007年 
102Development of a Speech Recognition System Using a Sparse Training Corpus 2007年 
103Acoustic and Linguistic Characterization of Spontaneous Speech 2007年 
104Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition 2007年 
105Development of a Speech Recognition System Using Machine Translated Data 日本音響学会 秋季研究発表会 2007年 
106Clustering Strategies for Hidden Markov Model-Based Polyglot Synthesis Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 2006年 
107Development of an Indonesian Large Vocabulary Continuous Speech Recognition System 日本音響学会 秋季研究発表会 2006年 
108話し言葉音声における音素の静的特徴量の分散と動的特徴量に関する分析 日本音響学会 秋季研究発表会 2006年 
109プレゼンテーション蓄積検索システムにおける講義・講演音声情報を利用した適合度の改善 電子情報通信学会 データ工学ワークショップ 2006年 
110マルチバンド音声認識のための LDA に基づく帯域重み推定手法 電子情報通信学会 音声研究会 2006年 
111話し言葉音声の音響的・言語的特徴の分析 電子情報通信学会 音声研究会 2006年 
112Acoustic and Linguistic Characterization of Spontaneous Speech 2006年 
113Progress on a Speaker Adaptable Polyglot Synthesizer 2006年 
114A Stream-Weight and Threshold Estimation Method Using Adaboost for Multi-Stream Speaker Verification 2006年 
115A Large Vocabulary Continuous Speech Recognition System for Indonesian Language 2006年 
116A Weight Estimation Method Using LDA for Multi-Band Speech Recognition 2006年 
117野球中継番組を対象とした音響情報を用いたシーン認識 日本音響学会 春季研究発表会 2006年 
118Development of a Dialogue System for Web Retrieval 日本音響学会 春季研究発表会 2006年 
119New Approach to Polyglot Synthesis: How to Speak Any Language with Anyone's Voice 2006年 
120Why is Automatic Recognition of Spontaneous Speech So Difficult? 2006年 
121講義音声認識における講義スライド情報の利用 電子情報通信学会 音声研究会 2006年 
122Toward Hidden Markov Model-Based Spontaneous Speech Synthesis Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 2006年 
123Cluster-Based Modeling for Ubiquitous Speech Recognition 2005年 
124HMM を用いた話し言葉音声合成に関する検討 日本音響学会 秋季研究発表会 2005年 
125Multimodal Speaker Verification Using Ear Image Features Extracted by PCA and ICA 2005年 
126Language Model Adaptation for Resource Deficient Language Using Translated Data 2005年 
127Cross-Language Synthesis with a Polyglot Synthesizer 2005年 
128Stream-Weight Optimization by LDA and Adaboost for Multi-Stream Speaker Verification 2005年 
129Analysis of Spectral Space Reduction in Spontaneous Speech and Its Effects on Speech Recognition Performance 2005年 
130Why Is the Recognition of Spontaneous Speech so Hard? 2005年 
131Sentence Extraction-Based Presentation Summarization Techniques and Evaluation Metrics 2005年 
132Sentence Extraction-Based Automatic Speech Summarization and Evaluation Techniques 2005年 
133Toward Robust Multimodal Speech Recognition 2005年 
134Speaker Adaptable Multilingual Synthesis 2005年 
135Polyglot Synthesis Using a Mixture of Monolingual Corpora 2005年 
136A Stream-Weight Optimization Method for Multi-Stream HMMs Based on Likelihood Value Normalization 2005年 
137マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討 電子情報通信学会 音声研究会 2005年 
138超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討 電子情報通信学会 音声研究会 2005年 
139HMM-Based Speaker Adaptable Polyglot Synthesizer – Development and Evaluation – 電子情報通信学会 音声研究会 2005年 
140超並列デコーダと逐次適応を用いた音声対話システム 日本音響学会 秋季研究発表会 2005年 
141Improvement of Language Model Adaptation Using Machine-Translated Text 日本音響学会 秋季研究発表会 2005年 
142マルチバンド音声認識における尤度重み推定法の検討 日本音響学会 秋季研究発表会 2005年 
143マルチストリーム話者照合におけるブースティングを用いた閾値の最適化 日本音響学会 秋季研究発表会 2005年 
144読み上げ音声に対する話し言葉音声の言語的特徴の分析 日本音響学会 秋季研究発表会 2005年 
145New Approach to Cross-Language Synthesis 日本音響学会 秋季研究発表会 2005年 
146重要文抽出による音声自動要約手法とその客観評価法についての検討 電子情報通信学会 音声研究会 2005年 
147Language Model Adaptation for ASR Using Machine-Translated Data 電子情報通信学会 音声研究会 2005年 
148HMM を用いた話し言葉音声合成の実現に向けての検討 電子情報通信学会 音声研究会 2005年 
149客観尺度を用いた音声自動要約手法の評価 日本音響学会 春季研究発表会 2005年 
150講演音声のインデキシングを目的としたセグメンテーション手法の検討 日本音響学会 春季研究発表会 2005年 
151Addition of New Languages to a Polyglot HMM-Based Synthesizer 日本音響学会 春季研究発表会 2005年 
152マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析 日本音響学会 春季研究発表会 2005年 
153実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法 情報処理学会 音声言語情報処理研究会 2005年 
154Noise-Robust Speaker Verification Using F0 Features 2004年 
155マルチストリーム話者照合のためのブースティングによる重み最適化 日本音響学会 秋季研究発表会 2004年 
156HMM 音声合成を利用したキャラクタの形状特徴に応じた音声合成法 日本音響学会 春季研究発表会 2004年 
157重要文抽出と文圧縮による英語音声の自動要約 話し言葉の科学と工学ワークショップ 2004年 
158横顔画像から抽出した口唇角度情報を用いたマルチモーダル音声認識 日本音響学会 秋季研究発表会 2004年 
159VoIP 携帯端末を利用した音声認証技術の検証 日本人間工学学会 モバイル人間工学研究部会 シンポジウム「ケータイ・カーナビの利用性と人間工学」 2004年 
160Improvement of Audio-Visual Speech Recognition in Cars 2004年 
161Noise-Robust Speech Recognition Using Multi-Band Spectral Features The Meeting of Acoustical Society of America 2004年 
162A Stream-Weight Optimization Method for Audio-Visual Speech Recognition Using Multi-Stream HMMs 2004年 
163Audio-Visual Speech Recognition Using New Lip Features Extracted from Side-Face Images 2004年 
164ハフ変換による基本周波数情報を用いた雑音に頑健な話者照合 日本音響学会 春季研究発表会 2004年 
165話し言葉音声認識における学習データ量と認識性能の関係 日本音響学会 秋季研究発表会 2004年 
166音声と耳介画像情報を用いたマルチモーダル話者照合の高精度化 日本音響学会 秋季研究発表会 2004年 
167マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討 電子情報通信学会 音声研究会 2004年 
168日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析 情報処理学会 音声言語情報処理研究会 2004年 
169講演音声を対象とした要約手法の評価に関する検討 日本音響学会 秋季研究発表会 2004年 
170マルチストリーム HMM における重み係数決定法に関する検討 日本音響学会 秋季研究発表会 2004年 
171Toward an HMM-Based Polyglot Synthesizer 日本音響学会 秋季研究発表会 2004年 
172日本語話し言葉音声と読み上げ音声の音響的特徴の比較 日本音響学会 秋季研究発表会 2004年 
173雑音に頑健な話者照合のための基本周波数情報の利用 電子情報通信学会 音声研究会 2004年 
174重要文抽出と文圧縮による音声自動要約手法の英語音声への適用 日本音響学会 春季研究発表会 2004年 
175周波数帯域ごとの重みつき尤度を用いた音声認識の検討 日本音響学会 春季研究発表会 2004年 
176尤度比最大基準によるストリーム重み最適化を用いたマルチモーダル音声認識の性能評価 日本音響学会 春季研究発表会 2004年 
177マルチモーダル音声認識におけるストリーム重み係数最適化の検討 電子情報通信学会 音声研究会 2003年 
178パーソナルロボット向けの家庭内雑音に頑健な音声認識の検討 日本音響学会 秋季研究発表会 2003年 
179マルチモーダル音声認識における音響・画像特徴の融合法に関する検討 日本音響学会 秋季研究発表会 2003年 
180横顔画像の口唇情報を利用したマルチモーダル音声認識 日本音響学会 秋季研究発表会 2003年 
181音声と顔画像を用いたマルチモーダル話者照合 日本音響学会 春季研究発表会 2003年 
182マルチモーダル音声認識のための画像特徴量の改善 日本音響学会 春季研究発表会 2003年 
183HMM 音声合成における残差駆動による自然性向上の検討 日本音響学会 春季研究発表会 2003年 
184音声と耳介画像を用いたマルチモーダル話者照合 日本音響学会 春季研究発表会 2003年 
185韓国人の日本語発声に対する発音誤りの自動検出・評定法 日本音響学会 秋季研究発表会 2003年 
186重みつきスペクトル特徴量を用いた雑音に頑健な音声認識 日本音響学会 秋季研究発表会 2003年 
187音声自動要約を利用した講演速聞きシステムの検討 情報処理学会 音声言語情報処理研究会 2003年 
188音声と耳介画像を用いたマルチモーダル個人認証 電子情報通信学会 音声研究会 2003年 
189横顔の動画像情報を用いたマルチモーダル音声認識 情報処理学会 音声言語情報処理研究会 2003年 
190雑音に頑健な音声認識のための韻律情報の利用 情報処理学会 音声言語情報処理研究会 2003年 
191Unsupervised Class-Based Language Model Adaptation for Spontaneous Speech Recognition 2003年 
192Unsupervised Language Model Adaptation Using Word Classes for Spontaneous Speech Recognition 2003年 
193Noise Robust Speech Recognition Using Prosodic Information 2003年 
194Audio-Visual Speech Recognition Using Lip Movement Extracted from Side-Face Images 2003年 
195Audio-Visual Person Authentication Using Speech and Ear Images 2003年 
196言語モデルの教師なしバッチ型話題適応 日本音響学会 春季研究発表会 2003年 
197周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識 電子情報通信学会 音声研究会 2003年 
198並列処理型計算機による混合主導型対話音声認識システムの構築 日本音響学会 秋季研究発表会 2002年 
199A Robust Multi-Modal Speech Recognition Method Using Optical-Flow Analysis 2002年 
200Noise Robust Speech Recognition Using F0 Contour Extracted by Hough Transform 2002年 
201Speech-Rate-Variable HMM-Based Japanese TTS System 2002年 
202Parallel Computing-Based Architecture for Mixed-Initiative Spoken Dialogue 2002年 
203オプティカルフローを用いたマルチモーダル音声認識法の提案と評価 情報処理学会 音声言語情報処理研究会 2002年 
204実環境におけるマルチモーダル音声認識の評価 日本音響学会 春季研究発表会 2002年 
205言語モデルのバッチ型教師なし適応化法 電子情報通信学会 音声研究会 2002年 
206ハフ変換による基本周波数情報を用いた雑音に頑健な音声認識 日本音響学会 秋季研究発表会 2002年 
207HMM 音声合成における数量化Ⅰ類を用いた発話速度制御法 日本音響学会 秋季研究発表会 2002年 
208並列処理型計算機を用いた音声対話システムの検討 人工知能学会 言語・音声理解と対話処理研究会 2002年 
209逐次話者適応を用いた並列処理型会議音声認識システムの検討 日本音響学会 春季研究発表会 2002年 
210雑音に頑健な基本周波数抽出法とその音声認識への適用 電子情報通信学会 音声研究会 2002年 
211HMM に基づく音声合成における様々な発話速度の実現 電子情報通信学会 音声研究会 2002年 
212数量化Ⅰ類によるF0パターンの生成の制御要因に関する検討 情報処理学会 音声言語情報処理研究会 2001年 
213自由発話を対象とした対話システムの構築と評価 情報処理学会 音声言語情報処理研究会 2001年 
214数量化Ⅰ類を用いたピッチパターン生成における制御要因の検討 日本音響学会 秋季研究発表会 2001年 
215ハフ変換を用いた雑音中の音声からの基本周波数抽出法 日本音響学会 秋季研究発表会 2001年 
216並列処理型会議音声認識システムの検討 日本音響学会 秋季研究発表会 2001年 
217オプティカルフローを用いたマルチモーダル音声認識の検討 日本音響学会 秋季研究発表会 2001年 
218Continuous Speech Recognition of Japanese Using Prosodic Word Boundaries Detected by Mora Transition Modeling of Fundamental Frequency Contours 2001年 
219Ubiquitous Speech Processing 2001年 
220Bimodal Speech Recognition Using Lip Movement Measured by Optical-Flow Analysis 2001年 
221ハフ変換による雑音に頑健な基本周波数抽出法 情報処理学会 音声言語情報処理研究会 2001年 
222Modeling and Generation of Accentual Phrase F0 Contours Based on Discrete HMMs Synchronized at Mora-unit Transitions 2000年 
223Detection of Prosodic Word Boundaries by Statistical Modeling of Mora Transitions of Fundamental Frequency Contours and Its Use for Continuous Speech Recognition 2000年 
224モーラ遷移 HMM に基づく F0 パターンのモデル化と生成 日本音響学会 春季研究発表会 2000年 
225句境界情報を利用した語彙制約のない姓名認識 日本音響学会 春季研究発表会 1999年 
226モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用 情報処理学会 音声言語情報処理研究会 1999年 
227Prosodic Word Boundary Detection Using Mora Transition Modeling of Fundamental Frequency Contours -Speaker Independent Experiments- 1999年 
228Speaker-Independent Detection of Prosodic Word Boundary Using Mora Transition Modeling of Fundamental Frequency Contours 1999年 
229Prosodic Word Boundary Detection Using Statistical Modeling of Moraic Fundamental Frequency Contours and Its Use for Continuous Speech Recognition 1999年 
230語彙制約なし音声認識へのアクセント句境界情報の利用 電子情報通信学会 音声研究会 1999年 
231タイプライタ型音声認識へのアクセント句境界情報の利用 日本音響学会 秋季研究発表会 1999年 
232Representing Prosodic Words Using Statistical Models of Moraic Transition of Fundamental Frequency Contours of Japanese 1998年 
233Accent Type Recognition and Syntactic Boundary Detection of Japanese Using Statistical Modeling of Moraic Transitions of Fundamental Frequency Contours 1998年 
234モーラ遷移確率モデルを用いたアクセント句の表現 日本音響学会 春季研究発表会 1998年 
235モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出 電子情報通信学会 音声研究会 1998年 
236モーラ遷移確率モデルを用いた句境界検出システムの語彙制約なし音声認識への応用 日本音響学会 秋季研究発表会 1998年 
237モーラ遷移確率モデルによる統語境界検出の改良 日本音響学会 秋季研究発表会 1997年 
238HMM による韻律パターン表現の一手法 日本音響学会 春季研究発表会 1997年 
239A Method of Representing Fundamental Frequency Contours of Japanese Using Statistical Models of Moraic Transition 1997年 
240モーラ遷移確率モデルを用いた統語境界の検出 電子情報通信学会 音声研究会 1997年 
241Detecting Phrase Boundaries by Low-Pass Filtering of Fundamental Frequency Contours 1997年 
242Posterior Use of Prosodic Features to Aid Speech Recognition Joint Meeting of Acoustical Society of America and Acoustic Society of Japan 1996年 
243Use of Prosodic Features in Speech Recognition 1996年 

 

受賞  
No.受賞年月授与機関賞名(対象業績)タイトル
12022年11月 第12回バイオメトリクスと認識・認証シンポジウム 優秀発表賞 深層学習に基づく話者照合システムに対する物真似タレントと一般人による声真似攻撃の分析 
22018年11月 第8回バイオメトリクスと認識・認証シンポジウム 優秀発表賞 物真似タレントと素人による声真似攻撃が話者照合に与える影響の分析 
32017年06月 電子情報通信学会 情報・システムソサイエティ査読功労賞 

 

共同研究・競争的資金等の研究課題  
No.提供機関制度名課題名等資金種別研究期間
1独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(C) 声真似による成りすまし攻撃に対する話者照合の耐性向上に関する研究 競争的資金  2019年 - 2021年 
2独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(B) マルチエージェント深層学習による音声因子分解 競争的資金  2019年 - 2021年 
3独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(B) 深層学習によるマルチモーダル時系列データ認識基盤の構築 競争的資金  2016年 - 2018年 
4独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(B) Deep Generative Model とその因子分解による音声情報処理基盤 競争的資金  2013年 - 2015年 
5独立行政法人日本学術振興会 科学研究費助成事業 基盤研究(C) 模倣音声による詐称攻撃に対して頑健な話者照合の研究 競争的資金  2013年 - 2015年 
6A Study on High-Performance Speaker Verification in Wearable Computing Environments 競争的資金  2009年 - 現在 
7栢森情報科学振興財団 栢森情報科学振興財団研究助成 ウェアラブルコンピュータ環境における高精度話者照合に関する研究 競争的資金  2008年 - 2010年 
8A Study on High-Performance Speech Recognition Decoder Based on Weighted Finite-State Transducers 競争的資金  2008年 - 現在 
9文部科学省 文部科学省科学研究補助金 若手研究(B) 公開鍵基盤(PKI)と話者照合技術の融合に関する研究 競争的資金  2005年 - 2007年 
10文部科学省 文部科学省科学研究補助金 若手研究(B) 音声と耳介画像を用いたマルチモーダル・バイオメトリック個人認証 競争的資金  2002年 - 2004年 
11日本学術振興会 科学研究費助成事業 遍在ウェアラブル計算環境における会議CSCWのための音声認識システムの研究  2000年 - 2002年