岩野　公司 (イワノ　コウジ,IWANO Koji)

基本情報	研究分野	研究業績	教育業績	社会貢献業績

書籍等出版物
No.	タイトル	担当区分	出版社	出版年月	担当範囲	ISBN
1	画像ラボ 2024年8月号	分担執筆	日本工業出版	2024年08月	運転者行動認識における局所情報の利用, pp.24-29
2	音声（下）	編者（編著者）	コロナ社	2023年01月		9784339013672
3	高精度化する個人認証技術～身体的、行動的認証からシステム開発、事例、国際標準化まで～	共著	株式会社エヌ・ティー・エス	2014年11月	第2編第5章第5節音声と顔/耳介画像を用いたマルチモーダル個人認証システムの開発	9784860434137
4	DSP for In-Vehicle and Mobile Systems	分担執筆	Springer-Verlag	2005年01月	Chapter 9, pp.139-152, Noise Robust Speech Recognition Using Prosodic Information	0387229787
5	Spoken Multimodal Human-Computer Dialogue in Mobile Environments	分担執筆	Springer-Verlag	2005年01月	Chapter 3, pp.37-53, A Robust Multimodal Speech Recognition Method Using Optical Flow Analysis	1402030738
6	Text to Speech Synthesis - New Paradigms and Advances -	分担執筆	Prentice Hall PTR	2004年07月	Chapter 8, pp.155-173, Prosody Control for HMM-Based Japanese TTS	013145661X

論文
No.	論文タイトル	誌名(出版物名)	巻	号	開始ページ	終了ページ	出版年月	DOI	査読の有無
1	Comparative Analysis of Voice Mimicry Attacks by High- and Low-Skilled Imitators on Speaker Verification Systems	2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)			1	6	2024年12月03日	https://doi.org/10.1109/apsipaasc63619.2025.108486931	査読有り
2	LDMSE: Low Computational Cost Generative Diffusion Model for Speech Enhancement	2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)			1	6	2024年12月03日	https://doi.org/10.1109/apsipaasc63619.2025.108490511	査読有り
3	Noise-Tolerant Time-Domain Speech Separation with Noise Bases	2021 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)			624	629	2021年12月16日		査読有り
4	Multimodal speech recognition using mouth images from depth camera	2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)			1233	1236	2017年12月	https://doi.org/10.1109/apsipa.2017.82822271	査読有り
5	アマチュアの身体表現にみる物理的特徴の分析 ―コスプレコミュニティの事例から―	情報文化学会誌	24	1	35	42	2017年09月		査読有り
6	TokyoTech at MediaEval 2016 Multimodal Person Discovery in Broadcast TV task	CEUR Workshop Proceedings	1739				2016年
7	Error Correction Using Long Context Match for Smartphone Speech Recognition	IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS	E98D	11	1932	1942	2015年11月	https://doi.org/10.1587/transinf.2015EDP71791	査読有り
8	Error Correction Using Long Context Match for Smartphone Speech Recognition	IEICE Transactions on Information and Systems	E98.D	11	1932	1942	2015年	https://doi.org/10.1587/transinf.2015edp71791	査読有り
9	Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition	15TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2014), VOLS 1-4			1194	1198	2014年		査読有り
10	AN EFFICIENT ERROR CORRECTION INTERFACE FOR SPEECH RECOGNITION ON MOBILE TOUCHSCREEN DEVICES	2014 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY SLT 2014			454	459	2014年		査読有り
11	Feature normalization based on non-extensive statistics for speech recognition	Speech Communication	55	5	587	599	2013年06月	https://doi.org/10.1016/j.specom.2013.02.0041	査読有り
12	A noise-robust speech recognition approach incorporating normalized speech/non-speech likelihood into hypothesis scores	SPEECH COMMUNICATION	55	2	377	386	2013年02月	https://doi.org/10.1016/j.specom.2012.10.0011	査読有り
13	Spectral subtraction based on non-extensive statistics for speech recognition	IEICE Transactions on Information and Systems	E96-D	8	1774	1782	2013年	https://doi.org/10.1587/transinf.E96.D.17741	査読有り
14	Detection of overlapped speech using lapel microphones in meeting	Speech Communication	55	10	941	949	2013年	https://doi.org/10.1016/j.specom.2013.06.0131	査読有り
15	Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity	13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3			1498	1501	2012年		査読有り
16	Q-Gaussian based spectral subtraction for robust speech recognition	13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3			1254	1257	2012年		査読有り
17	軽量な画像特徴量を用いたマルチモーダル音声認識	電子情報通信学会論文誌	Vol.J95-D	No.3	618	627	2012年		査読有り
18	An efficient prosody adaptation method and its application to HMM-based speech synthesis	APSIPA ASC 2010 - Asia-Pacific Signal and Information Processing Association Annual Summit and Conference			82	85	2010年
19	VAD-measure-embedded Decoder with Online Model Adaptation	11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4			3122	+	2010年		査読有り
20	GENERALIZATION OF SPECIALIZED ON-THE-FLY COMPOSITION	2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS			4317	4320	2009年		査読有り
21	Noise robust speech recognition using spectral subtraction and F 0 information extracted by Hough transform	APSIPA ASC 2009 - Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference			631	634	2009年
22	Development of a WFST based speech recognition system for a resource deficient language using machine translation	APSIPA ASC 2009 - Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference			50	56	2009年
23	WFST 音声認識デコーダにおける on-the-fly 合成の最適化処理	電子情報通信学会論文誌	Vol.J92-D	No.7	1026	1035	2009年		査読有り
24	Robust Speech Recognition Using VAD-measure-embedded Decoder	INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5			2203	+	2009年		査読有り
25	Optimization of On-the-Fly Composition for WFST-Based Speech Recognition Decoders	The IEICE Transactions on Information and Systems	Vol.J92-D	No.7	1026	1035	2009年		査読無し
26	Differences between acoustic characteristics of spontaneous and read speech and their effects on speech recognition performance	COMPUTER SPEECH AND LANGUAGE	22	2	171	184	2008年04月	https://doi.org/10.1016/j.csl.2007.07.0031	査読有り
27	Evaluation of a noise-robust multi-stream speaker verification method using F(0) information	IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS	E91D	3	549	557	2008年03月	https://doi.org/10.1093/ietisy/e9l-d.3.5491	査読有り
28	Implementation and Evaluation of Fast On-the-fly WFST Composition Algorithms	INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5			2110	2113	2008年		査読有り
29	Thai Broadcast News Corpus Construction and Evaluation	SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008			1249	1254	2008年		査読有り
30	Language Model Adaptation Using Machine-Translated Text for Resource-Deficient Languages	EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING	Vol.2008	Article ID 573832	7 pages		2008年	https://doi.org/10.1155/2008/5738321	査読有り
31	Combining Gaussian mixture model with Global Variance term to improve the quality of an HMM-based polyglot speech synthesizer	2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3			1241	+	2007年		査読有り
32	音声情報を統合したプレゼンテーションコンテンツ検索	電子情報通信学会論文誌	Vol.J90-D	No.2	209	222	2007年		査読無し
33	Presentation-Content Retrieval Integrated with the Speech Information	IEICE Transactions on Information and Systems	Vol.J90-D	No.2	209	222	2007年		査読無し
34	Audio-Visual Speech Recognition Using Lip Information Extracted from Side-Face Images	EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING	Vol.2007	Article ID 64506	9 pages		2007年	https://doi.org/10.1155/2007/645061	査読有り
35	The effect of spectral space reduction in spontaneous speech on recognition performances	2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3			473	+	2007年		査読有り
36	Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition	INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4			89	92	2007年		査読有り
37	New approach to the polyglot speech generation by means of an HMM-based speaker adaptable synthesizer	SPEECH COMMUNICATION	48	10	1227	1242	2006年10月	https://doi.org/10.1016/j.specom.2006.05.0031	査読有り
38	Sentence-extractive automatic speech summarization and evaluation techniques	SPEECH COMMUNICATION	48	9	1151	1161	2006年09月	https://doi.org/10.1016/j.specom.2006.04.0051	査読有り
39	A stream-weight and threshold estimation method using Adaboost for multi-stream speaker verification	2006 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL V, PROCEEDINGS			1081	+	2006年		査読有り
40	A Weight Estimation Method Using LDA for Multi-Band Speech Recognition	INTERSPEECH 2006 AND 9TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, VOLS 1-5			2534	2537	2006年		査読有り
41	A stream-weight and threshold estimation method using adaboost for multi-stream speaker verification	2006 IEEE International Conference on Acoustics, Speech and Signal Processing, Vols 1-13			5939	5942	2006年		査読有り
42	Analysis and recognition of spontaneous speech using Corpus of Spontaneous Japanese	SPEECH COMMUNICATION	47	1-2	208	219	2005年09月	https://doi.org/10.1016/j.specom.2005.02.0101	査読有り
43	Stream-weight optimization by LDA and adaboost for multi-stream speaker verification	9th European Conference on Speech Communication and Technology			2185	2188	2005年
44	Multimodal speaker verification using ear image features extracted by PCA and ICA	Lecture Notes in Computer Science	3546		588	596	2005年	https://doi.org/10.1007/11527923_611
45	Language model adaptation for resource deficient languages using translated data	9th European Conference on Speech Communication and Technology			1329	1332	2005年
46	Analysis of spectral space reduction in spontaneous speech and its effects on speech recognition performances	9th European Conference on Speech Communication and Technology			3381	3384	2005年
47	Cross-language synthesis with a polyglot synthesizer	9th European Conference on Speech Communication and Technology			1477	1480	2005年
48	Cluster-based modeling for ubiquitous speech recognition	9th European Conference on Speech Communication and Technology			2865	2868	2005年
49	Polyglot synthesis using a mixture of monolingual corpora	ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings	I		I1	I4	2005年	https://doi.org/10.1109/ICASSP.2005.14150351	査読有り
50	A stream-weight optimization method for multi-stream HMMS based on likelihood value normalization	2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5			469	472	2005年		査読有り
51	Sentence extraction-based presentation summarization techniques and evaluation metrics	2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5			1065	1068	2005年		査読有り
52	A ROBUST MULTIMODAL SPEECH RECOGNITION METHOD USING OPTICAL FLOW ANALYSIS	SPOKEN MULTIMODAL HUMAN-COMPUTER DIALOGUE IN MOBILE ENVIRONMENTS	28		37	53	2005年		査読有り
53	Why is the recognition of spontaneous speech so hard?	TEXT, SPEECH AND DIALOGUE, PROCEEDINGS	3658		9	22	2005年		査読有り
54	Noise robust speech recognition using F-0 contour information	IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS	E87D	5	1102	1109	2004年05月		査読有り
55	Multi-modal speech recognition using optical-flow analysis for lip images	JOURNAL OF VLSI SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY	36	2-3	117	124	2004年02月		査読有り
56	Noise-robust speaker verification using F0 features	8th International Conference on Spoken Language Processing, ICSLP 2004			1417	1420	2004年
57	A stream-weight optimization method for audio-visual speech recognition using multi-stream HMMS	2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS			857	860	2004年		査読有り
58	Unsupervised class-based language model adaptation for spontaneous speech recognition	2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS			236	239	2003年		査読有り
59	Parallel computing-based architecture for mixed-initiative spoken dialogue	FOURTH IEEE INTERNATIONAL CONFERENCE ON MULTIMODAL INTERFACES, PROCEEDINGS			53	58	2002年		査読有り
60	Noise robust speech recognition using F0 contour extracted by Hough transform	7th International Conference on Spoken Language Processing, ICSLP 2002			941	944	2002年
61	Ubiquitous speech processing	2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I-VI, PROCEEDINGS			13	16	2001年		査読有り
62	語彙制約なし音声認識へのアクセント句境界検出の統合	電子情報通信学会論文誌	Vol.J83-D-II	No.10	1977	1985	2000年		査読有り
63	Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition	ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings	3		1763	1766	2000年	https://doi.org/10.1109/ICASSP.2000.8620941	査読有り
64	Integration of Prosodic Word Boundary Detection to Unlimited-Vocabulary Speech Recognition	IEICE Transactions on Information and Systems	Vol.J83-D-II	No.10	1977	1985	2000年		査読無し
65	A Statistical Modeling of Fundamental Frequency Contours in Moraic Unit and Its Use for the Detection of Prosodic Word Boundaries	IPSJ Journal	Vol.40	No.4	1356	1364	1999年		査読無し
66	モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出	情報処理学会論文誌	Vol.40	No.4	1356	1364	1999年		査読有り
67	Prosodic word boundary detection using statistical modeling of moraic fundamental frequency contours and its use for continuous speech recognition	ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings	1		133	136	1999年	https://doi.org/10.1109/icassp.1999.7580801

MISC
No.	MISCタイトル	誌名	巻	号	開始ページ	終了ページ	出版年月(日)
1	「東京都市大学科学体験教室」における科学コミュニケーション	東京都市大学横浜キャンパス情報メディアジャーナル		19	48	49	2018年04月
2	複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」)	電子情報通信学会技術研究報告 = IEICE technical report : 信学技報	116	189	53	58	2016年08月24日
3	声真似が話者照合に与える影響と物真似音声の音響特徴の分析 (音声)	電子情報通信学会技術研究報告 = IEICE technical report : 信学技報	114	411	43	48	2015年01月22日
4	Error Correction Using Long Context Match for Smartphone Speech Recognition (音声) -- (第16回音声言語シンポジウム)	電子情報通信学会技術研究報告 = IEICE technical report : 信学技報	114	365	117	122	2014年12月15日
5	Error Correction Using Long Context Match for Smartphone Speech Recognition	研究報告音声言語情報処理（SLP）	2014	22	1	6	2014年12月08日
6	口唇の深度画像を用いたマルチモーダル音声認識	研究報告音声言語情報処理（SLP）	2014	2	1	6	2014年07月17日
7	複数ピンマイクで収音された会議音声の重畳区間検出	研究報告音声言語情報処理（SLP）	2012	6	1	6	2012年07月12日
8	Two-pass Approach for Recognizing Code-Switching Speech (パターン認識・メディア理解)	電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解	111	430	225	229	2012年02月02日
9	Nonlinear normalization using q-logarithm for robust speech recognition (音声)	電子情報通信学会技術研究報告. SP, 音声	111	153	45	50	2011年07月14日
10	音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討	電子情報通信学会技術研究報告. SP, 音声	110	81	49	54	2010年06月10日
11	HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討	研究報告音声言語情報処理（SLP）	2010	12	1	6	2010年02月05日
12	ウェアラブルコンピュータ環境における話者照合	東京都市大学環境情報学部紀要	11		80	87	2010年02月
13	F_0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討	電子情報通信学会技術研究報告. SP, 音声	109	99	87	92	2009年06月17日
14	話し言葉音声合成の韻律制御に関する検討	研究報告音声言語情報処理（SLP）	2009	23	1	8	2009年05月14日
15	耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化	電子情報通信学会技術研究報告. SP, 音声	108	422	19	24	2009年01月22日
16	マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討	情報処理学会研究報告	2009-NL-191, 2009-SLP-76	24	1	6	2009年
17	WFST音声認識デコーダの高機能化とその応用－on-the-fly合成法の検討－	情報処理学会研究報告音声言語情報処理（SLP）	2008	102	29	34	2008年10月17日
18	Accent analysis for Mandarin large vocabulary continuous speech recognition	聴覚研究会資料	38	2	123	127	2008年03月20日
19	Accent analysis for Mandarin large vocabulary continuous speech recognition (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")	電子情報通信学会技術研究報告. SP, 音声	107	551	87	91	2008年03月13日
20	Initial evaluation of the drivers' Japanese speech corpus in a car environment (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")	電子情報通信学会技術研究報告. SP, 音声	107	551	93	98	2008年03月13日
21	マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討	電子情報通信学会技術研究報告. SP, 音声	107	406	43	47	2007年12月13日
22	HMMを用いた話し言葉音声合成のためのモデルの検討	電子情報通信学会技術研究報告. SP, 音声	107	77	13	18	2007年05月24日
23	対話システムへの利用を想定したマルチモーダル音声認識の検討	電子情報通信学会技術研究報告. SP, 音声	107	77	19	24	2007年05月24日
24	講義音声認識における講義スライド情報の利用	情報処理学会研究報告音声言語情報処理（SLP）	2006	136	221	226	2006年12月22日
25	講義音声認識における講義スライド情報の利用	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	106	442	43	48	2006年12月15日
26	マルチバンド音声認識のためのLDAに基づく帯域重み推定手法	電子情報通信学会技術研究報告. SP, 音声	106	78	13	18	2006年05月19日
27	話し言葉音声の音響的・言語的特徴の分析	電子情報通信学会技術研究報告. SP, 音声	106	78	19	24	2006年05月19日
28	HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	105	494	127	132	2005年12月22日
29	HMM-based speaker adaptable polyglot synthesizer - Development and evaluation 窶骭	情報処理学会研究報告音声言語情報処理（SLP）	2005	127	217	222	2005年12月22日
30	超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討	情報処理学会研究報告音声言語情報処理（SLP）	2005	127	91	96	2005年12月22日
31	超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	105	494	1	6	2005年12月22日
32	マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討	電子情報通信学会技術研究報告. SP, 音声	105	495	1	6	2005年12月21日
33	マルチストリーム話者照合におけるブースティングに基づく閥値最適化法の検討	情報処理学会研究報告音声言語情報処理（SLP）	2005	127	1	6	2005年12月21日
34	重要文抽出による音声自動要約手法とその客観評価法についての検討(要約, 検索, 認識・理解・対話・一般)	電子情報通信学会技術研究報告. SP, 音声	105	132	1	6	2005年06月16日
35	機械翻訳データを用いた音声認識のための言語モデル適応(多言語, CSJ, 認識・理解・対話・一般)	電子情報通信学会技術研究報告. SP, 音声	105	132	19	23	2005年06月16日
36	HMMを用いた話し言葉音声合成の実現に向けての検討(一般, 一般, チュートリアルレクチャー)	電子情報通信学会技術研究報告. SP, 音声	105	98	25	30	2005年05月20日
37	講演音声のインデキシングを目的としたセグメンテーション手法の検討	日本音響学会研究発表会講演論文集	2005	1	7	8	2005年03月08日
38	客観尺度を用いた音声自動要約手法の評価	日本音響学会研究発表会講演論文集	2005	1	3	4	2005年03月08日
39	多言語HMM音声合成における言語の追加	日本音響学会研究発表会講演論文集	2005	1	197	198	2005年03月08日
40	マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析	日本音響学会研究発表会講演論文集	2005	1	231	232	2005年03月08日
41	実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法	情報処理学会研究報告音声言語情報処理（SLP）	2005	12	29	34	2005年02月04日
42	マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	104	539	85	90	2004年12月21日
43	マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討	情報処理学会研究報告音声言語情報処理（SLP）	2004	131	175	180	2004年12月21日
44	日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析	情報処理学会研究報告音声言語情報処理（SLP）	2004	103	7	12	2004年10月22日
45	雑音に頑健な話者照合のための基本周波数情報の利用	情報処理学会研究報告音声言語情報処理（SLP）	2004	57	31	36	2004年05月28日
46	雑音に頑健な話者照合のための基本周波数情報の利用	電子情報通信学会技術研究報告. SP, 音声	104	87	1	6	2004年05月21日
47	周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識	情報処理学会研究報告音声言語情報処理（SLP）	2003	124	19	24	2003年12月18日
48	マルチモーダル音声認識におけるストリーム重み係数最適化の検討	情報処理学会研究報告音声言語情報処理（SLP）	2003	124	241	246	2003年12月18日
49	マルチモーダル音声認識におけるストリーム重み係数最適化の検討	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	103	517	241	246	2003年12月11日
50	周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	103	517	19	24	2003年12月11日
51	音声と耳介画像を用いたマルチモーダル個人認証	電子情報通信学会技術研究報告. SP, 音声	103	94	25	30	2003年05月30日
52	横顔の動画像情報を用いたマルチモーダル音声認識	情報処理学会研究報告音声言語情報処理（SLP）	2003	58	61	66	2003年05月27日
53	雑音に頑健な音声認識のための韻律情報の利用	情報処理学会研究報告音声言語情報処理（SLP）	2003	58	55	60	2003年05月27日
54	音声自動要約を利用した講演速聞きシステムの検討	情報処理学会研究報告自然言語処理（NL）	2003	57	83	88	2003年05月26日
55	音声と耳介画像を用いたマルチモーダル話者照合	日本音響学会研究発表会講演論文集	2003	1	109	110	2003年03月18日
56	音声と顔画像を用いたマルチモーダル話者照合	日本音響学会研究発表会講演論文集	2003	1	107	108	2003年03月18日
57	HMM音声合成における残差駆動による自然性向上の検討	日本音響学会研究発表会講演論文集	2003	1	241	242	2003年03月18日
58	マルチモーダル音声認識のための画像特徴量の改善	日本音響学会研究発表会講演論文集	2003	1	195	196	2003年03月18日
59	言語モデルの教師なしバッチ型話題適応	日本音響学会研究発表会講演論文集	2003	1	129	130	2003年03月18日
60	言語モデルのバッチ型教師なし適応化法	情報処理学会研究報告音声言語情報処理（SLP）	2002	121	183	188	2002年12月16日
61	言語モデルのバッチ型教師なし適応化法	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	102	528	19	24	2002年12月13日
62	並列処理型計算機を用いた音声対話システムの検討 (テーマ:一般)	言語・音声理解と対話処理研究会	35		21	26	2002年06月07日
63	雑音に頑健な基本周波数抽出法とその音声認識への適用	電子情報通信学会技術研究報告. EA, 応用音響	102	33	37	42	2002年04月19日
64	逐次話者適応を用いた並列処理型会議音声認識システムの検討	日本音響学会研究発表会講演論文集	2002	1	105	106	2002年03月18日
65	実環境におけるマルチモーダル音声認識の評価	日本音響学会研究発表会講演論文集	2002	1	151	152	2002年03月18日
66	オプティカルフローを用いたマルチモーダル音声認識法の提案と評価	情報処理学会研究報告ヒューマンコンピュータインタラクション（HCI）	2002	10	33	38	2002年02月01日
67	HMMに基づく音声合成における様々な発話速度の実現	信学技報					2002年
68	数量化I類によるF0パターン生成の制御要因に関する検討	情報処理学会研究報告音声言語情報処理（SLP）	2001	100	15	20	2001年10月19日
69	ハフ変換による雑音に頑健な基本周波数抽出法	情報処理学会研究報告音声言語情報処理（SLP）	2001	100	9	14	2001年10月19日
70	並列処理型会議音声認識システムの検討	日本音響学会研究発表会講演論文集	2001	2	113	114	2001年10月01日
71	数量化I類を用いたピッチパターン生成における制御要因の検討	日本音響学会研究発表会講演論文集	2001	2	221	222	2001年10月01日
72	オプティカルフローを用いたマルチモーダル音声認識の検討	日本音響学会研究発表会講演論文集	2001	2	27	28	2001年10月01日
73	ハフ変換を用いた雑音中の音声からの基本周波数抽出法	日本音響学会研究発表会講演論文集	2001	2	209	210	2001年10月01日
74	自由発話を対象とした対話システムの構築と評価	情報処理学会研究報告音声言語情報処理（SLP）	2001	55	79	86	2001年06月01日
75	語彙制約なし音声認識へのアクセント句境界情報の利用	電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション	99	524	73	78	1999年12月21日
76	語彙制約なし音声認識へのアクセント句境界情報の利用	情報処理学会研究報告音声言語情報処理（SLP）	1999	108	205	210	1999年12月20日
77	句境界情報を利用した語彙制約のない姓名認識	日本音響学会研究発表会講演論文集	1999	1	151	152	1999年03月01日
78	モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用	情処研報			73	78	1999年
79	モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出	電子情報通信学会技術研究報告. SP, 音声	98	106	1	8	1998年06月12日
80	モーラ遷移確率モデルを用いたアクセント句の表現	日本音響学会研究発表会講演論文集	1998	1	153	154	1998年03月01日
81	モーラ遷移確率モデルによる統語境界検出の改良	日本音響学会研究発表会講演論文集	1997	2	133	134	1997年09月01日
82	モーラ遷移確率モデルを用いた統語境界の検出	電子情報通信学会技術研究報告. SP, 音声	97	114	33	40	1997年06月19日
83	HMMによる韻律パターン表現の一手法	音講論			341	342	1997年

講演・口頭発表等
No.	講演・口頭発表タイトル	会議名	発表年月日	主催者	開催地
1	X-vector に基づく話者照合システムにおける声真似攻撃への対策	情報処理学会第87回全国大会	2025年03月15日
2	音声強調のための拡散モデルにおける計算量の削減	日本音響学会2024年春季研究発表会	2024年03月06日
3	拡散モデルを用いた音声強調の計算量削減	電子情報通信学会音声研究会	2023年12月02日
4	畳み込みニューラルネットワークを用いた運転者行動認識の性能改善の検討	映像情報メディア学会メディア工学研究会	2023年09月07日
5	深層学習に基づく画像認識技術を用いた部屋の片付き具合の自動推定	情報処理学会第85回全国大会	2023年03月04日
6	発声障がい者のための分析合成を用いたモーラ単位音声出力システムの開発	情報処理学会第85回全国大会	2023年03月02日
7	深層学習を用いたイラスト顔画像からの情報抽出	情報処理学会第85回全国大会	2023年03月02日
8	マルチモーダル音声認識と話し言葉音声の分析 ― 古井研究室での研究の思い出 ―	情報処理学会音声言語情報処理研究会	2023年01月26日
9	深層学習に基づく話者照合システムに対する物真似タレントと一般人による声真似攻撃の分析	第12回バイオメトリクスと認識・認証シンポジウム	2022年11月16日
10	x-vectorに基づく話者照合システムに対する一般人と物真似タレントによる声真似攻撃の分析	電子情報通信学会総合大会情報・システムソサイエティ特別企画学生ポスターセッション	2022年03月16日
11	画像処理技術を用いた部屋の片付き具合の自動推定	電子情報通信学会総合大会情報・システムソサイエティ特別企画学生ポスターセッション	2022年03月16日
12	話者照合システムに対する人間と声質変換の詐称攻撃力の比較	電子情報通信学会総合大会情報・システムソサイエティ特別企画学生ポスターセッション	2022年03月16日
13	隠れマルコフモデルを用いた楽曲の旋律と歌詞の自動対応推定	情報処理学会第83回全国大会	2021年03月18日
14	雑音の基底信号を用いた耐雑音性の高い時間領域音声分離	電子情報通信学会音声研究会	2021年03月03日
15	Team Takoyaki submission for VoxCeleb Speaker Recognition Challenge 2020	the VoxSRC Workshop 2020	2020年10月
16	詐称者の物真似スキルを考慮した話者照合における声真似攻撃の分析	情報処理学会第82回全国大会	2020年03月
17	実環境における自動撮影画像を対象とした畳み込みニューラルネットワークに基づく鳥類の出現検出と鳥種認識	映像情報メディア学会メディア工学研究会	2020年02月08日
18	声質の類似性に基づく歌手マップの作成	情報処理学会全国大会講演論文集	2019年03月
19	写真スライドショー作成のための不要画像の自動検出	情報処理学会全国大会講演論文集	2019年03月
20	物真似タレントと素人による声真似攻撃が話者照合に与える影響の分析	第8回バイオメトリクスと認識・認証シンポジウム	2018年11月
21	動作認識による実在確認機能を有するマルチモーダル個人認証システム	第8回バイオメトリクスと認識・認証シンポジウム	2018年11月
22	Kinectを用いた実在確認機能を有するマルチモーダル個人認証システム	電子情報通信学会技術研究報告	2018年03月11日
23	深層ニューラルネットワークを用いたフォント変換	電子情報通信学会総合大会情報・システムソサイエティ特別企画学生ポスターセッション予稿集	2018年03月
24	Multimodal speech recognition using mouth images from depth camera	Proceedings - 9th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017	2018年02月05日
25	ニューラルネットワークを利用した写真画像の自然物度の推定	電子情報通信学会技術研究報告	2017年09月28日
26	口唇深度画像を利用したディープオートエンコーダに基づくマルチモーダル音声認識	日本音響学会研究発表会講演論文集(CD-ROM)	2017年09月11日
27	プロの物真似タレントの声真似が話者照合に与える影響と音響特徴の分析	電子情報通信学会技術研究報告	2017年08月23日
28	口唇の深度画像を用いたディープオートエンコーダによるマルチモーダル音声認識	情報処理学会研究報告(Web)	2017年07月20日
29	日本語楽曲の旋律と歌詞のアクセントの関係分析のための自動対応付け	情報処理学会全国大会講演論文集	2017年03月16日
30	話者照合におけるプロの物真似タレントの声真似攻撃の影響の分析	情報処理学会全国大会講演論文集	2017年03月16日
31	話者認識と顔画像認識を用いた映像におけるマルチモーダル人物同定	日本音響学会研究発表会講演論文集(CD-ROM)	2017年03月01日
32	Analysis of Voice Imitation by Professional/Non-Professional Impersonators Based on Kullback–Leibler Divergence between Acoustic Models	Joint Meeting of Acoustical Society of America and Acoustic Society of Japan	2016年11月
33	複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善	電子情報通信学会技術研究報告	2016年08月17日
34	演奏楽器の時間構造情報に基づく楽曲検索とDNNを用いた楽器演奏区間検出	情報処理学会研究報告(Web)	2016年05月14日
35	TokyoTech at MediaEval 2016 Multimodal Person Discovery in Broadcast TV task	CEUR Workshop Proceedings	2016年01月01日
36	声真似が話者照合に与える影響と物真似音声の音響特徴の分析	電子情報通信学会音声研究会	2015年
37	An Efficient Error Correction Interface for Speech Recognition on Mobile Touchscreen Devices	2014 IEEE Workshop on Spoken Language Technology, SLT 2014 - Proceedings	2014年04月01日
38	Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition	Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH	2014年01月01日
39	複数スマートフォンで収録された多人数会話音声における対話グループ検出と話者決定	電子情報通信学会音声研究会	2014年
40	Error Correction Using Long Context Match for Smartphone Speech Recognition	情報処理学会音声言語情報処理研究会	2014年
41	複数スマートフォンで収録された多人数会話音声の話者決定	情報処理学会全国大会	2014年
42	An Efficient Error Correction Method for Smartphone Speech Recognition	日本音響学会秋季研究発表会	2014年
43	話者照合への影響を考慮した模倣音声の音響分析	情報処理学会全国大会	2014年
44	モーラ単位音声出力を用いた発声障がい者のための会話支援システムの生成応答の評価	日本音響学会春季研究発表会	2014年
45	発声障がい者の会話支援を目的としたモーラ単位音声出力システムの開発と評価	第109回ヒューマンインタフェース学会研究会	2014年
46	口唇の深度画像を用いたマルチモーダル音声認識	情報処理学会音声言語情報処理研究会	2014年
47	発声様態依存モデルを用いた話者認識	日本音響学会春季研究発表会	2013年
48	モーラ単位音声出力を用いた発声障がい者のための会話支援システム	日本音響学会秋季研究発表会	2013年
49	クラウド時代の音声情報処理	栢森情報科学振興財団第13回Kフォーラム	2013年
50	継続利用する話者照合システムにおける性能の経時変化に関する検討	情報処理学会全国大会	2013年
51	音楽の調変化に対する相対的な色聴の分析	情報処理学会全国大会	2013年
52	音声認識のためのqガウス分布を用いた音響モデル	日本音響学会春季研究発表会	2013年
53	Q-Gaussian Based Spectral Subtraction for Robust Speech Recognition	13th Annual Conference of the International Speech Communication Association 2012, INTERSPEECH 2012	2012年12月01日
54	A Compensation Technique Using q-Logarithm for Noisy Speech Recognition	日本音響学会春季研究発表会	2012年
55	クラウド時代の新しい音声研究パラダイム	情報処理学会音声言語情報処理研究会	2012年
56	複数ピンマイクで収音された会議音声の重畳区間検出	情報処理学会音声言語情報処理研究会	2012年
57	Two-pass Approach for Recognizing Code-Switching Speech	電子情報通信学会音声研究会	2012年
58	Recognition of Indonesian Code-Switching Speech	日本音響学会春季研究発表会	2012年
59	Spectral Subtraction Based on q-Gaussian Assumption for Noise Robust Speech Recognition	日本音響学会春季研究発表会	2012年
60	集団共有型ロボットにおける応答の差別化による親近感向上の検討	情報処理学会全国大会	2012年
61	相互スペクトル減算と振幅スペクトル相関を用いた会議音声の重畳区間検出	日本音響学会春季研究発表会	2012年
62	Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity		2012年
63	Nonlinear Normalization Using q-logarithm for Robust Speech Recognition	電子情報通信学会音声研究会	2011年
64	自然性と個人性に優れた音声合成のための音素継続時間長適応法	日本音響学会春季研究発表会	2010年
65	VAD の信頼度を利用した音声認識デコーダの検討	日本音響学会秋季研究発表会	2010年
66	音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討	電子情報通信学会音声研究会	2010年
67	HMM 音声合成における自然性と個人性に優れた韻律モデル適応法の検討	情報処理学会音声言語情報処理研究会	2010年
68	VAD-measure-embedded Decoder with Online Model Adaptation		2010年
69	An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis		2010年
70	マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討	情報処理学会音声言語情報処理研究会	2009年
71	Recent Development of WFST-Based Speech Recognition Decoder		2009年
72	Generalization of Specialized On-the-fly Composition		2009年
73	耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化	電子情報通信学会音声研究会	2009年
74	マルチモーダル音声対話システムのための音響・画像重みの推定手法の検討	日本音響学会春季研究発表会	2009年
75	立体的音像定位を利用した音声合成システムの検討	日本音響学会春季研究発表会	2009年
76	ハフ変換による基本周波数情報を用いた耐雑音音声認識の高性能化の検討	日本音響学会春季研究発表会	2009年
77	Robust Speech Recognition Using VAD-Measure-Embedded Decoder		2009年
78	Noise Robust Speech Recognition Using Spectral Subtraction and F0 Information Extracted by Hough Transform		2009年
79	Development of a WFST based Speech Recognition System for a Resource Deficient Language Using Machine Translation		2009年
80	自然性と個人性に優れたF0 パターン適応法	日本音響学会秋季研究発表会	2009年
81	VAD の信頼度を利用した雑音に頑健な音声認識デコーダの検討	日本音響学会秋季研究発表会	2009年
82	F0パターン生成モデルのための数量化Ⅰ類の平均値置換による話者適応法の検討	電子情報通信学会音声研究会	2009年
83	話し言葉音声合成の韻律制御に関する検討	情報処理学会音声言語情報処理研究会	2009年
84	An Automatic Singing Voice Evaluation Method for Voice Training	日本音響学会春季研究発表会	2008年
85	Thai Broadcast News Corpus Construction and Evaluation		2008年
86	Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment		2008年
87	WFST 音声認識デコーダの高機能化とその応用 ― on-the-fly 合成法の検討 ―	情報処理学会音声言語情報処理研究会	2008年
88	音響的な認識誤りフレームに対するケプストラム空間拡張の効果	日本音響学会秋季研究発表会	2008年
89	話し言葉音声合成における韻律制御要因の有効性の評価	日本音響学会秋季研究発表会	2008年
90	WFST-based Icelandic ASR Using Machine Translation	日本音響学会秋季研究発表会	2008年
91	音声入力によるマウスの直接操作の検討	日本音響学会秋季研究発表会	2008年
92	WFST デコーダにおける on-the-fly 合成の高速化に関する検討	日本音響学会秋季研究発表会	2008年
93	スペクトルサブトラクションとハフ変換による基本周波数情報を用いた耐雑音音声認識	日本音響学会秋季研究発表会	2008年
94	Analysis of Spectral Reduction and Its Effects on Speech Recognition Performance	The First Nijmegen Speech Reduction Workshop: Disappearing Sounds	2008年
95	WFST音声認識デコーダの省メモリ化に関する検討	日本音響学会春季研究発表会	2008年
96	Development of a Thai Broadcast News Corpus and an LVCSR System	日本音響学会春季研究発表会	2008年
97	An Analysis of Accent Effects on Mandarin Large Vocabulary Continuous Speech Recognition	日本音響学会春季研究発表会	2008年
98	Development of a Speech Recognition System for Icelandic Using Machine Translated Text		2008年
99	Accent Analysis for Mandarin Large Vocabulary Continuous Speech Recognition		2008年
100	Development of a Speech Recognition System Using Machine Translated Data	日本音響学会秋季研究発表会	2007年
101	HMM を用いた話し言葉音声合成におけるモデルの構築とその合成音声への影響	日本音響学会春季研究発表会	2007年
102	話者照合におけるマルチストリーム重みの教師なし推定法の検討	日本音響学会春季研究発表会	2007年
103	スライド資料を用いた講義音声認識のための言語モデル適応	日本音響学会春季研究発表会	2007年
104	Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition		2007年
105	The Effect of Spectral Space Reduction in Spontaneous Speech on Recognition Performances		2007年
106	Combining Gaussian Mixture Model with Global Variance Term to Improve the Quality of an HMM-Based Polyglot Speech Synthesizer		2007年
107	話し言葉音声の認識精度向上のために	人工知能学会 AIチャレンジ研究会	2007年
108	対話音声を対象とした不特定話者マルチモーダル音声認識の検討	日本音響学会春季研究発表会	2007年
109	話者照合における雑音に非依存なマルチストリーム重みの検討	日本音響学会秋季研究発表会	2007年
110	HMM を用いた話し言葉音声合成のためのモデルの検討	電子情報通信学会音声研究会	2007年
111	Development of a Speech Recognition System Using a Sparse Training Corpus		2007年
112	Acoustic and Linguistic Characterization of Spontaneous Speech		2007年
113	講義音声認識における講義スライド情報の利用	電子情報通信学会音声研究会	2006年
114	Acoustic and Linguistic Characterization of Spontaneous Speech		2006年
115	Progress on a Speaker Adaptable Polyglot Synthesizer		2006年
116	A Stream-Weight and Threshold Estimation Method Using Adaboost for Multi-Stream Speaker Verification		2006年
117	A Large Vocabulary Continuous Speech Recognition System for Indonesian Language		2006年
118	A Weight Estimation Method Using LDA for Multi-Band Speech Recognition		2006年
119	New Approach to Polyglot Synthesis: How to Speak Any Language with Anyone's Voice		2006年
120	Why is Automatic Recognition of Spontaneous Speech So Difficult?		2006年
121	Toward Hidden Markov Model-Based Spontaneous Speech Synthesis	Joint Meeting of Acoustical Society of America and Acoustic Society of Japan	2006年
122	Clustering Strategies for Hidden Markov Model-Based Polyglot Synthesis	Joint Meeting of Acoustical Society of America and Acoustic Society of Japan	2006年
123	Development of an Indonesian Large Vocabulary Continuous Speech Recognition System	日本音響学会秋季研究発表会	2006年
124	話し言葉音声における音素の静的特徴量の分散と動的特徴量に関する分析	日本音響学会秋季研究発表会	2006年
125	マルチバンド音声認識のための LDA に基づく帯域重み推定手法	電子情報通信学会音声研究会	2006年
126	話し言葉音声の音響的・言語的特徴の分析	電子情報通信学会音声研究会	2006年
127	Development of a Dialogue System for Web Retrieval	日本音響学会春季研究発表会	2006年
128	野球中継番組を対象とした音響情報を用いたシーン認識	日本音響学会春季研究発表会	2006年
129	プレゼンテーション蓄積検索システムにおける講義・講演音声情報を利用した適合度の改善	電子情報通信学会データ工学ワークショップ	2006年
130	Polyglot Synthesis Using a Mixture of Monolingual Corpora		2005年
131	Language Model Adaptation for Resource Deficient Language Using Translated Data		2005年
132	Cross-Language Synthesis with a Polyglot Synthesizer		2005年
133	Stream-Weight Optimization by LDA and Adaboost for Multi-Stream Speaker Verification		2005年
134	Cluster-Based Modeling for Ubiquitous Speech Recognition		2005年
135	Analysis of Spectral Space Reduction in Spontaneous Speech and Its Effects on Speech Recognition Performance		2005年
136	超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討	電子情報通信学会音声研究会	2005年
137	Why Is the Recognition of Spontaneous Speech so Hard?		2005年
138	Sentence Extraction-Based Presentation Summarization Techniques and Evaluation Metrics		2005年
139	Sentence Extraction-Based Automatic Speech Summarization and Evaluation Techniques		2005年
140	Toward Robust Multimodal Speech Recognition		2005年
141	Speaker Adaptable Multilingual Synthesis		2005年
142	Multimodal Speaker Verification Using Ear Image Features Extracted by PCA and ICA		2005年
143	A Stream-Weight Optimization Method for Multi-Stream HMMs Based on Likelihood Value Normalization		2005年
144	マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討	電子情報通信学会音声研究会	2005年
145	マルチストリーム話者照合におけるブースティングを用いた閾値の最適化	日本音響学会秋季研究発表会	2005年
146	読み上げ音声に対する話し言葉音声の言語的特徴の分析	日本音響学会秋季研究発表会	2005年
147	HMM-Based Speaker Adaptable Polyglot Synthesizer – Development and Evaluation –	電子情報通信学会音声研究会	2005年
148	超並列デコーダと逐次適応を用いた音声対話システム	日本音響学会秋季研究発表会	2005年
149	Improvement of Language Model Adaptation Using Machine-Translated Text	日本音響学会秋季研究発表会	2005年
150	マルチバンド音声認識における尤度重み推定法の検討	日本音響学会秋季研究発表会	2005年
151	HMM を用いた話し言葉音声合成に関する検討	日本音響学会秋季研究発表会	2005年
152	重要文抽出による音声自動要約手法とその客観評価法についての検討	電子情報通信学会音声研究会	2005年
153	HMM を用いた話し言葉音声合成の実現に向けての検討	電子情報通信学会音声研究会	2005年
154	客観尺度を用いた音声自動要約手法の評価	日本音響学会春季研究発表会	2005年
155	講演音声のインデキシングを目的としたセグメンテーション手法の検討	日本音響学会春季研究発表会	2005年
156	Addition of New Languages to a Polyglot HMM-Based Synthesizer	日本音響学会春季研究発表会	2005年
157	マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析	日本音響学会春季研究発表会	2005年
158	実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法	情報処理学会音声言語情報処理研究会	2005年
159	New Approach to Cross-Language Synthesis	日本音響学会秋季研究発表会	2005年
160	Language Model Adaptation for ASR Using Machine-Translated Data	電子情報通信学会音声研究会	2005年
161	Audio-Visual Speech Recognition Using New Lip Features Extracted from Side-Face Images		2004年
162	Noise-Robust Speaker Verification Using F0 Features		2004年
163	話し言葉音声認識における学習データ量と認識性能の関係	日本音響学会秋季研究発表会	2004年
164	音声と耳介画像情報を用いたマルチモーダル話者照合の高精度化	日本音響学会秋季研究発表会	2004年
165	マルチストリーム話者照合のためのブースティングによる重み最適化	日本音響学会秋季研究発表会	2004年
166	マルチストリーム HMM における重み係数決定法に関する検討	日本音響学会秋季研究発表会	2004年
167	Toward an HMM-Based Polyglot Synthesizer	日本音響学会秋季研究発表会	2004年
168	日本語話し言葉音声と読み上げ音声の音響的特徴の比較	日本音響学会秋季研究発表会	2004年
169	雑音に頑健な話者照合のための基本周波数情報の利用	電子情報通信学会音声研究会	2004年
170	重要文抽出と文圧縮による音声自動要約手法の英語音声への適用	日本音響学会春季研究発表会	2004年
171	周波数帯域ごとの重みつき尤度を用いた音声認識の検討	日本音響学会春季研究発表会	2004年
172	尤度比最大基準によるストリーム重み最適化を用いたマルチモーダル音声認識の性能評価	日本音響学会春季研究発表会	2004年
173	ハフ変換による基本周波数情報を用いた雑音に頑健な話者照合	日本音響学会春季研究発表会	2004年
174	HMM 音声合成を利用したキャラクタの形状特徴に応じた音声合成法	日本音響学会春季研究発表会	2004年
175	重要文抽出と文圧縮による英語音声の自動要約	話し言葉の科学と工学ワークショップ	2004年
176	横顔画像から抽出した口唇角度情報を用いたマルチモーダル音声認識	日本音響学会秋季研究発表会	2004年
177	Noise-Robust Speech Recognition Using Multi-Band Spectral Features	The Meeting of Acoustical Society of America	2004年
178	VoIP 携帯端末を利用した音声認証技術の検証	日本人間工学学会モバイル人間工学研究部会シンポジウム「ケータイ・カーナビの利用性と人間工学」	2004年
179	マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討	電子情報通信学会音声研究会	2004年
180	日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析	情報処理学会音声言語情報処理研究会	2004年
181	講演音声を対象とした要約手法の評価に関する検討	日本音響学会秋季研究発表会	2004年
182	Improvement of Audio-Visual Speech Recognition in Cars		2004年
183	A Stream-Weight Optimization Method for Audio-Visual Speech Recognition Using Multi-Stream HMMs		2004年
184	パーソナルロボット向けの家庭内雑音に頑健な音声認識の検討	日本音響学会秋季研究発表会	2003年
185	横顔画像の口唇情報を利用したマルチモーダル音声認識	日本音響学会秋季研究発表会	2003年
186	HMM 音声合成における残差駆動による自然性向上の検討	日本音響学会春季研究発表会	2003年
187	音声と耳介画像を用いたマルチモーダル話者照合	日本音響学会春季研究発表会	2003年
188	Unsupervised Class-Based Language Model Adaptation for Spontaneous Speech Recognition		2003年
189	Unsupervised Language Model Adaptation Using Word Classes for Spontaneous Speech Recognition		2003年
190	Noise Robust Speech Recognition Using Prosodic Information		2003年
191	Audio-Visual Speech Recognition Using Lip Movement Extracted from Side-Face Images		2003年
192	Audio-Visual Person Authentication Using Speech and Ear Images		2003年
193	言語モデルの教師なしバッチ型話題適応	日本音響学会春季研究発表会	2003年
194	周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識	電子情報通信学会音声研究会	2003年
195	マルチモーダル音声認識におけるストリーム重み係数最適化の検討	電子情報通信学会音声研究会	2003年
196	マルチモーダル音声認識における音響・画像特徴の融合法に関する検討	日本音響学会秋季研究発表会	2003年
197	音声と顔画像を用いたマルチモーダル話者照合	日本音響学会春季研究発表会	2003年
198	マルチモーダル音声認識のための画像特徴量の改善	日本音響学会春季研究発表会	2003年
199	韓国人の日本語発声に対する発音誤りの自動検出・評定法	日本音響学会秋季研究発表会	2003年
200	重みつきスペクトル特徴量を用いた雑音に頑健な音声認識	日本音響学会秋季研究発表会	2003年
201	音声自動要約を利用した講演速聞きシステムの検討	情報処理学会音声言語情報処理研究会	2003年
202	音声と耳介画像を用いたマルチモーダル個人認証	電子情報通信学会音声研究会	2003年
203	横顔の動画像情報を用いたマルチモーダル音声認識	情報処理学会音声言語情報処理研究会	2003年
204	雑音に頑健な音声認識のための韻律情報の利用	情報処理学会音声言語情報処理研究会	2003年
205	逐次話者適応を用いた並列処理型会議音声認識システムの検討	日本音響学会春季研究発表会	2002年
206	A Robust Multi-Modal Speech Recognition Method Using Optical-Flow Analysis		2002年
207	HMM に基づく音声合成における様々な発話速度の実現	電子情報通信学会音声研究会	2002年
208	オプティカルフローを用いたマルチモーダル音声認識法の提案と評価	情報処理学会音声言語情報処理研究会	2002年
209	Parallel Computing-Based Architecture for Mixed-Initiative Spoken Dialogue		2002年
210	Speech-Rate-Variable HMM-Based Japanese TTS System		2002年
211	Noise Robust Speech Recognition Using F0 Contour Extracted by Hough Transform		2002年
212	雑音に頑健な基本周波数抽出法とその音声認識への適用	電子情報通信学会音声研究会	2002年
213	言語モデルのバッチ型教師なし適応化法	電子情報通信学会音声研究会	2002年
214	ハフ変換による基本周波数情報を用いた雑音に頑健な音声認識	日本音響学会秋季研究発表会	2002年
215	実環境におけるマルチモーダル音声認識の評価	日本音響学会春季研究発表会	2002年
216	並列処理型計算機による混合主導型対話音声認識システムの構築	日本音響学会秋季研究発表会	2002年
217	HMM 音声合成における数量化Ⅰ類を用いた発話速度制御法	日本音響学会秋季研究発表会	2002年
218	並列処理型計算機を用いた音声対話システムの検討	人工知能学会言語・音声理解と対話処理研究会	2002年
219	数量化Ⅰ類を用いたピッチパターン生成における制御要因の検討	日本音響学会秋季研究発表会	2001年
220	ハフ変換による雑音に頑健な基本周波数抽出法	情報処理学会音声言語情報処理研究会	2001年
221	数量化Ⅰ類によるF0パターンの生成の制御要因に関する検討	情報処理学会音声言語情報処理研究会	2001年
222	自由発話を対象とした対話システムの構築と評価	情報処理学会音声言語情報処理研究会	2001年
223	オプティカルフローを用いたマルチモーダル音声認識の検討	日本音響学会秋季研究発表会	2001年
224	並列処理型会議音声認識システムの検討	日本音響学会秋季研究発表会	2001年
225	ハフ変換を用いた雑音中の音声からの基本周波数抽出法	日本音響学会秋季研究発表会	2001年
226	Bimodal Speech Recognition Using Lip Movement Measured by Optical-Flow Analysis		2001年
227	Ubiquitous Speech Processing		2001年
228	Continuous Speech Recognition of Japanese Using Prosodic Word Boundaries Detected by Mora Transition Modeling of Fundamental Frequency Contours		2001年
229	Detection of Prosodic Word Boundaries by Statistical Modeling of Mora Transitions of Fundamental Frequency Contours and Its Use for Continuous Speech Recognition		2000年
230	Modeling and Generation of Accentual Phrase F0 Contours Based on Discrete HMMs Synchronized at Mora-unit Transitions		2000年
231	モーラ遷移 HMM に基づく F0 パターンのモデル化と生成	日本音響学会春季研究発表会	2000年
232	Prosodic Word Boundary Detection Using Statistical Modeling of Moraic Fundamental Frequency Contours and Its Use for Continuous Speech Recognition		1999年
233	Prosodic Word Boundary Detection Using Mora Transition Modeling of Fundamental Frequency Contours -Speaker Independent Experiments-		1999年
234	Speaker-Independent Detection of Prosodic Word Boundary Using Mora Transition Modeling of Fundamental Frequency Contours		1999年
235	語彙制約なし音声認識へのアクセント句境界情報の利用	電子情報通信学会音声研究会	1999年
236	タイプライタ型音声認識へのアクセント句境界情報の利用	日本音響学会秋季研究発表会	1999年
237	句境界情報を利用した語彙制約のない姓名認識	日本音響学会春季研究発表会	1999年
238	モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用	情報処理学会音声言語情報処理研究会	1999年
239	Representing Prosodic Words Using Statistical Models of Moraic Transition of Fundamental Frequency Contours of Japanese		1998年
240	モーラ遷移確率モデルを用いた句境界検出システムの語彙制約なし音声認識への応用	日本音響学会秋季研究発表会	1998年
241	モーラ遷移確率モデルを用いたアクセント句の表現	日本音響学会春季研究発表会	1998年
242	Accent Type Recognition and Syntactic Boundary Detection of Japanese Using Statistical Modeling of Moraic Transitions of Fundamental Frequency Contours		1998年
243	モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出	電子情報通信学会音声研究会	1998年
244	モーラ遷移確率モデルによる統語境界検出の改良	日本音響学会秋季研究発表会	1997年
245	Detecting Phrase Boundaries by Low-Pass Filtering of Fundamental Frequency Contours		1997年
246	A Method of Representing Fundamental Frequency Contours of Japanese Using Statistical Models of Moraic Transition		1997年
247	モーラ遷移確率モデルを用いた統語境界の検出	電子情報通信学会音声研究会	1997年
248	HMM による韻律パターン表現の一手法	日本音響学会春季研究発表会	1997年
249	Use of Prosodic Features in Speech Recognition		1996年
250	Posterior Use of Prosodic Features to Aid Speech Recognition	Joint Meeting of Acoustical Society of America and Acoustic Society of Japan	1996年

受賞
No.	受賞年月	授与機関	賞名	(対象業績)タイトル
1	2022年11月	第12回バイオメトリクスと認識・認証シンポジウム	優秀発表賞	深層学習に基づく話者照合システムに対する物真似タレントと一般人による声真似攻撃の分析
2	2018年11月	第8回バイオメトリクスと認識・認証シンポジウム	優秀発表賞	物真似タレントと素人による声真似攻撃が話者照合に与える影響の分析
3	2017年06月	電子情報通信学会	情報・システムソサイエティ査読功労賞

共同研究・競争的資金等の研究課題
No.	提供機関	制度名	課題名等	資金種別	研究期間
1	独立行政法人日本学術振興会	科学研究費助成事業基盤研究(C)	声真似による成りすまし攻撃に対する話者照合の耐性向上に関する研究	競争的資金	2019年 - 2021年
2	独立行政法人日本学術振興会	科学研究費助成事業基盤研究(B)	マルチエージェント深層学習による音声因子分解	競争的資金	2019年 - 2021年
3	独立行政法人日本学術振興会	科学研究費助成事業基盤研究(B)	深層学習によるマルチモーダル時系列データ認識基盤の構築	競争的資金	2016年 - 2018年
4	独立行政法人日本学術振興会	科学研究費助成事業基盤研究(B)	Deep Generative Model とその因子分解による音声情報処理基盤	競争的資金	2013年 - 2015年
5	独立行政法人日本学術振興会	科学研究費助成事業基盤研究(C)	模倣音声による詐称攻撃に対して頑健な話者照合の研究	競争的資金	2013年 - 2015年
6			A Study on High-Performance Speaker Verification in Wearable Computing Environments	競争的資金	2009年 - 現在
7	栢森情報科学振興財団	栢森情報科学振興財団研究助成	ウェアラブルコンピュータ環境における高精度話者照合に関する研究	競争的資金	2008年 - 2010年
8			A Study on High-Performance Speech Recognition Decoder Based on Weighted Finite-State Transducers	競争的資金	2008年 - 現在
9	文部科学省	文部科学省科学研究補助金若手研究(B)	公開鍵基盤(PKI)と話者照合技術の融合に関する研究	競争的資金	2005年 - 2007年
10	文部科学省	文部科学省科学研究補助金若手研究(B)	音声と耳介画像を用いたマルチモーダル・バイオメトリック個人認証	競争的資金	2002年 - 2004年
11	日本学術振興会	科学研究費助成事業	遍在ウェアラブル計算環境における会議CSCWのための音声認識システムの研究		2000年 - 2002年