論文 |
No. | 論文タイトル | 誌名(出版物名) | 巻 | 号 | 開始ページ | 終了ページ | 出版年月 | DOI | 査読の有無 |
1 | LDMSE: Low Computational Cost Generative Diffusion Model for Speech Enhancement  | 2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) | | | 1 | 6 | 2024年12月03日 | https://doi.org/10.1109/apsipaasc63619.2025.108490511 | 査読有り |
2 | Comparative Analysis of Voice Mimicry Attacks by High- and Low-Skilled Imitators on Speaker Verification Systems  | 2024 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) | | | 1 | 6 | 2024年12月03日 | https://doi.org/10.1109/apsipaasc63619.2025.108486931 | 査読有り |
3 | Noise-Tolerant Time-Domain Speech Separation with Noise Bases | 2021 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) | | | 624 | 629 | 2021年12月16日 | | 査読有り |
4 | Multimodal speech recognition using mouth images from depth camera  | 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) | | | 1233 | 1236 | 2017年12月 | https://doi.org/10.1109/apsipa.2017.82822271 | 査読有り |
5 | アマチュアの身体表現にみる物理的特徴の分析 ―コスプレコミュニティの事例から― | 情報文化学会誌 | 24 | 1 | 35 | 42 | 2017年09月 | | 査読有り |
6 | TokyoTech at MediaEval 2016 Multimodal Person Discovery in Broadcast TV task | CEUR Workshop Proceedings | 1739 | | | | 2016年 | | |
7 | Error Correction Using Long Context Match for Smartphone Speech Recognition | IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS | E98D | 11 | 1932 | 1942 | 2015年11月 | https://doi.org/10.1587/transinf.2015EDP71791 | 査読有り |
8 | Error Correction Using Long Context Match for Smartphone Speech Recognition  | IEICE Transactions on Information and Systems | E98.D | 11 | 1932 | 1942 | 2015年 | https://doi.org/10.1587/transinf.2015edp71791 | 査読有り |
9 | AN EFFICIENT ERROR CORRECTION INTERFACE FOR SPEECH RECOGNITION ON MOBILE TOUCHSCREEN DEVICES | 2014 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY SLT 2014 | | | 454 | 459 | 2014年 | | 査読有り |
10 | Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition | 15TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2014), VOLS 1-4 | | | 1194 | 1198 | 2014年 | | 査読有り |
11 | Feature normalization based on non-extensive statistics for speech recognition  | Speech Communication | 55 | 5 | 587 | 599 | 2013年06月 | https://doi.org/10.1016/j.specom.2013.02.0041 | 査読有り |
12 | A noise-robust speech recognition approach incorporating normalized speech/non-speech likelihood into hypothesis scores  | SPEECH COMMUNICATION | 55 | 2 | 377 | 386 | 2013年02月 | https://doi.org/10.1016/j.specom.2012.10.0011 | 査読有り |
13 | Spectral subtraction based on non-extensive statistics for speech recognition  | IEICE Transactions on Information and Systems | E96-D | 8 | 1774 | 1782 | 2013年 | https://doi.org/10.1587/transinf.E96.D.17741 | 査読有り |
14 | Detection of overlapped speech using lapel microphones in meeting  | Speech Communication | 55 | 10 | 941 | 949 | 2013年 | https://doi.org/10.1016/j.specom.2013.06.0131 | 査読有り |
15 | Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity | 13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 | | | 1498 | 1501 | 2012年 | | 査読有り |
16 | 軽量な画像特徴量を用いたマルチモーダル音声認識 | 電子情報通信学会論文誌 | Vol.J95-D | No.3 | 618 | 627 | 2012年 | | 査読有り |
17 | Q-Gaussian based spectral subtraction for robust speech recognition | 13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3 | | | 1254 | 1257 | 2012年 | | 査読有り |
18 | VAD-measure-embedded Decoder with Online Model Adaptation | 11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4 | | | 3122 | + | 2010年 | | 査読有り |
19 | An efficient prosody adaptation method and its application to HMM-based speech synthesis | APSIPA ASC 2010 - Asia-Pacific Signal and Information Processing Association Annual Summit and Conference | | | 82 | 85 | 2010年 | | |
20 | Development of a WFST based speech recognition system for a resource deficient language using machine translation | APSIPA ASC 2009 - Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference | | | 50 | 56 | 2009年 | | |
21 | Optimization of On-the-Fly Composition for WFST-Based Speech Recognition Decoders | The IEICE Transactions on Information and Systems | Vol.J92-D | No.7 | 1026 | 1035 | 2009年 | | 査読無し |
22 | WFST 音声認識デコーダにおける on-the-fly 合成の最適化処理 | 電子情報通信学会論文誌 | Vol.J92-D | No.7 | 1026 | 1035 | 2009年 | | 査読有り |
23 | Robust Speech Recognition Using VAD-measure-embedded Decoder | INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5 | | | 2203 | + | 2009年 | | 査読有り |
24 | GENERALIZATION OF SPECIALIZED ON-THE-FLY COMPOSITION | 2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS | | | 4317 | 4320 | 2009年 | | 査読有り |
25 | Noise robust speech recognition using spectral subtraction and F 0 information extracted by Hough transform | APSIPA ASC 2009 - Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference | | | 631 | 634 | 2009年 | | |
26 | Differences between acoustic characteristics of spontaneous and read speech and their effects on speech recognition performance | COMPUTER SPEECH AND LANGUAGE | 22 | 2 | 171 | 184 | 2008年04月 | https://doi.org/10.1016/j.csl.2007.07.0031 | 査読有り |
27 | Evaluation of a noise-robust multi-stream speaker verification method using F(0) information | IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS | E91D | 3 | 549 | 557 | 2008年03月 | https://doi.org/10.1093/ietisy/e9l-d.3.5491 | 査読有り |
28 | Thai Broadcast News Corpus Construction and Evaluation | SIXTH INTERNATIONAL CONFERENCE ON LANGUAGE RESOURCES AND EVALUATION, LREC 2008 | | | 1249 | 1254 | 2008年 | | 査読有り |
29 | Language Model Adaptation Using Machine-Translated Text for Resource-Deficient Languages | EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING | Vol.2008 | Article ID 573832 | 7 pages | | 2008年 | https://doi.org/10.1155/2008/5738321 | 査読有り |
30 | Implementation and Evaluation of Fast On-the-fly WFST Composition Algorithms | INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5 | | | 2110 | 2113 | 2008年 | | 査読有り |
31 | Presentation-Content Retrieval Integrated with the Speech Information | IEICE Transactions on Information and Systems | Vol.J90-D | No.2 | 209 | 222 | 2007年 | | 査読無し |
32 | Audio-Visual Speech Recognition Using Lip Information Extracted from Side-Face Images | EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING | Vol.2007 | Article ID 64506 | 9 pages | | 2007年 | https://doi.org/10.1155/2007/645061 | 査読有り |
33 | The effect of spectral space reduction in spontaneous speech on recognition performances | 2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3 | | | 473 | + | 2007年 | | 査読有り |
34 | Combining Gaussian mixture model with Global Variance term to improve the quality of an HMM-based polyglot speech synthesizer | 2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PTS 1-3 | | | 1241 | + | 2007年 | | 査読有り |
35 | Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition  | INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4 | | | 89 | 92 | 2007年 | | 査読有り |
36 | 音声情報を統合したプレゼンテーションコンテンツ検索 | 電子情報通信学会論文誌 | Vol.J90-D | No.2 | 209 | 222 | 2007年 | | 査読無し |
37 | New approach to the polyglot speech generation by means of an HMM-based speaker adaptable synthesizer | SPEECH COMMUNICATION | 48 | 10 | 1227 | 1242 | 2006年10月 | https://doi.org/10.1016/j.specom.2006.05.0031 | 査読有り |
38 | Sentence-extractive automatic speech summarization and evaluation techniques | SPEECH COMMUNICATION | 48 | 9 | 1151 | 1161 | 2006年09月 | https://doi.org/10.1016/j.specom.2006.04.0051 | 査読有り |
39 | A stream-weight and threshold estimation method using Adaboost for multi-stream speaker verification | 2006 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL V, PROCEEDINGS | | | 1081 | + | 2006年 | | 査読有り |
40 | A stream-weight and threshold estimation method using adaboost for multi-stream speaker verification | 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, Vols 1-13 | | | 5939 | 5942 | 2006年 | | 査読有り |
41 | A Weight Estimation Method Using LDA for Multi-Band Speech Recognition | INTERSPEECH 2006 AND 9TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, VOLS 1-5 | | | 2534 | 2537 | 2006年 | | 査読有り |
42 | Analysis and recognition of spontaneous speech using Corpus of Spontaneous Japanese | SPEECH COMMUNICATION | 47 | 1-2 | 208 | 219 | 2005年09月 | https://doi.org/10.1016/j.specom.2005.02.0101 | 査読有り |
43 | A stream-weight optimization method for multi-stream HMMS based on likelihood value normalization | 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5 | | | 469 | 472 | 2005年 | | 査読有り |
44 | Sentence extraction-based presentation summarization techniques and evaluation metrics | 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5 | | | 1065 | 1068 | 2005年 | | 査読有り |
45 | A ROBUST MULTIMODAL SPEECH RECOGNITION METHOD USING OPTICAL FLOW ANALYSIS | SPOKEN MULTIMODAL HUMAN-COMPUTER DIALOGUE IN MOBILE ENVIRONMENTS | 28 | | 37 | 53 | 2005年 | | 査読有り |
46 | Why is the recognition of spontaneous speech so hard? | TEXT, SPEECH AND DIALOGUE, PROCEEDINGS | 3658 | | 9 | 22 | 2005年 | | 査読有り |
47 | Cross-language synthesis with a polyglot synthesizer | 9th European Conference on Speech Communication and Technology | | | 1477 | 1480 | 2005年 | | |
48 | Cluster-based modeling for ubiquitous speech recognition | 9th European Conference on Speech Communication and Technology | | | 2865 | 2868 | 2005年 | | |
49 | Stream-weight optimization by LDA and adaboost for multi-stream speaker verification | 9th European Conference on Speech Communication and Technology | | | 2185 | 2188 | 2005年 | | |
50 | Analysis of spectral space reduction in spontaneous speech and its effects on speech recognition performances | 9th European Conference on Speech Communication and Technology | | | 3381 | 3384 | 2005年 | | |
51 | Language model adaptation for resource deficient languages using translated data | 9th European Conference on Speech Communication and Technology | | | 1329 | 1332 | 2005年 | | |
52 | Multimodal speaker verification using ear image features extracted by PCA and ICA | Lecture Notes in Computer Science | 3546 | | 588 | 596 | 2005年 | https://doi.org/10.1007/11527923_611 | |
53 | Polyglot synthesis using a mixture of monolingual corpora | ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings | I | | I1 | I4 | 2005年 | https://doi.org/10.1109/ICASSP.2005.14150351 | 査読有り |
54 | Noise robust speech recognition using F-0 contour information | IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS | E87D | 5 | 1102 | 1109 | 2004年05月 | | 査読有り |
55 | Multi-modal speech recognition using optical-flow analysis for lip images | JOURNAL OF VLSI SIGNAL PROCESSING SYSTEMS FOR SIGNAL IMAGE AND VIDEO TECHNOLOGY | 36 | 2-3 | 117 | 124 | 2004年02月 | | 査読有り |
56 | A stream-weight optimization method for audio-visual speech recognition using multi-stream HMMS | 2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS | | | 857 | 860 | 2004年 | | 査読有り |
57 | Noise-robust speaker verification using F0 features | 8th International Conference on Spoken Language Processing, ICSLP 2004 | | | 1417 | 1420 | 2004年 | | |
58 | Unsupervised class-based language model adaptation for spontaneous speech recognition | 2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PROCEEDINGS | | | 236 | 239 | 2003年 | | 査読有り |
59 | Parallel computing-based architecture for mixed-initiative spoken dialogue | FOURTH IEEE INTERNATIONAL CONFERENCE ON MULTIMODAL INTERFACES, PROCEEDINGS | | | 53 | 58 | 2002年 | | 査読有り |
60 | Noise robust speech recognition using F0 contour extracted by Hough transform | 7th International Conference on Spoken Language Processing, ICSLP 2002 | | | 941 | 944 | 2002年 | | |
61 | Ubiquitous speech processing | 2001 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS I-VI, PROCEEDINGS | | | 13 | 16 | 2001年 | | 査読有り |
62 | Integration of Prosodic Word Boundary Detection to Unlimited-Vocabulary Speech Recognition | IEICE Transactions on Information and Systems | Vol.J83-D-II | No.10 | 1977 | 1985 | 2000年 | | 査読無し |
63 | 語彙制約なし音声認識へのアクセント句境界検出の統合 | 電子情報通信学会論文誌 | Vol.J83-D-II | No.10 | 1977 | 1985 | 2000年 | | 査読有り |
64 | Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition | ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings | 3 | | 1763 | 1766 | 2000年 | https://doi.org/10.1109/ICASSP.2000.8620941 | 査読有り |
65 | モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出 | 情報処理学会論文誌 | Vol.40 | No.4 | 1356 | 1364 | 1999年 | | 査読有り |
66 | Prosodic word boundary detection using statistical modeling of moraic fundamental frequency contours and its use for continuous speech recognition | ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings | 1 | | 133 | 136 | 1999年 | https://doi.org/10.1109/icassp.1999.7580801 | |
67 | A Statistical Modeling of Fundamental Frequency Contours in Moraic Unit and Its Use for the Detection of Prosodic Word Boundaries | IPSJ Journal | Vol.40 | No.4 | 1356 | 1364 | 1999年 | | 査読無し |
MISC |
No. | MISCタイトル | 誌名 | 巻 | 号 | 開始ページ | 終了ページ | 出版年月(日) |
1 | 「東京都市大学 科学体験教室」における科学コミュニケーション | 東京都市大学横浜キャンパス情報メディアジャーナル | | 19 | 48 | 49 | 2018年04月 |
2 | 複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 (音声) -- (オーガナイズドセッション「あらゆる音を対象とした情報処理の実現に向けて」)  | 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 | 116 | 189 | 53 | 58 | 2016年08月24日 |
3 | 声真似が話者照合に与える影響と物真似音声の音響特徴の分析 (音声)  | 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 | 114 | 411 | 43 | 48 | 2015年01月22日 |
4 | Error Correction Using Long Context Match for Smartphone Speech Recognition (音声) -- (第16回音声言語シンポジウム)  | 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 | 114 | 365 | 117 | 122 | 2014年12月15日 |
5 | Error Correction Using Long Context Match for Smartphone Speech Recognition  | 研究報告音声言語情報処理(SLP) | 2014 | 22 | 1 | 6 | 2014年12月08日 |
6 | 口唇の深度画像を用いたマルチモーダル音声認識  | 研究報告音声言語情報処理(SLP) | 2014 | 2 | 1 | 6 | 2014年07月17日 |
7 | 複数ピンマイクで収音された会議音声の重畳区間検出  | 研究報告音声言語情報処理(SLP) | 2012 | 6 | 1 | 6 | 2012年07月12日 |
8 | Two-pass Approach for Recognizing Code-Switching Speech (パターン認識・メディア理解)  | 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 | 111 | 430 | 225 | 229 | 2012年02月02日 |
9 | Nonlinear normalization using q-logarithm for robust speech recognition (音声)  | 電子情報通信学会技術研究報告. SP, 音声 | 111 | 153 | 45 | 50 | 2011年07月14日 |
10 | 音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討  | 電子情報通信学会技術研究報告. SP, 音声 | 110 | 81 | 49 | 54 | 2010年06月10日 |
11 | HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討  | 研究報告音声言語情報処理(SLP) | 2010 | 12 | 1 | 6 | 2010年02月05日 |
12 | ウェアラブルコンピュータ環境における話者照合 | 東京都市大学環境情報学部紀要 | 11 | | 80 | 87 | 2010年02月 |
13 | F_0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討  | 電子情報通信学会技術研究報告. SP, 音声 | 109 | 99 | 87 | 92 | 2009年06月17日 |
14 | 話し言葉音声合成の韻律制御に関する検討  | 研究報告音声言語情報処理(SLP) | 2009 | 23 | 1 | 8 | 2009年05月14日 |
15 | 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化  | 電子情報通信学会技術研究報告. SP, 音声 | 108 | 422 | 19 | 24 | 2009年01月22日 |
16 | マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討 | 情報処理学会研究報告 | 2009-NL-191, 2009-SLP-76 | 24 | 1 | 6 | 2009年 |
17 | WFST音声認識デコーダの高機能化とその応用-on-the-fly合成法の検討-  | 情報処理学会研究報告音声言語情報処理(SLP) | 2008 | 102 | 29 | 34 | 2008年10月17日 |
18 | Accent analysis for Mandarin large vocabulary continuous speech recognition  | 聴覚研究会資料 | 38 | 2 | 123 | 127 | 2008年03月20日 |
19 | Accent analysis for Mandarin large vocabulary continuous speech recognition (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")  | 電子情報通信学会技術研究報告. SP, 音声 | 107 | 551 | 87 | 91 | 2008年03月13日 |
20 | Initial evaluation of the drivers' Japanese speech corpus in a car environment (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")  | 電子情報通信学会技術研究報告. SP, 音声 | 107 | 551 | 93 | 98 | 2008年03月13日 |
21 | マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討 | 電子情報通信学会技術研究報告. SP, 音声 | 107 | 406 | 43 | 47 | 2007年12月13日 |
22 | 対話システムへの利用を想定したマルチモーダル音声認識の検討  | 電子情報通信学会技術研究報告. SP, 音声 | 107 | 77 | 19 | 24 | 2007年05月24日 |
23 | HMMを用いた話し言葉音声合成のためのモデルの検討  | 電子情報通信学会技術研究報告. SP, 音声 | 107 | 77 | 13 | 18 | 2007年05月24日 |
24 | 講義音声認識における講義スライド情報の利用  | 情報処理学会研究報告音声言語情報処理(SLP) | 2006 | 136 | 221 | 226 | 2006年12月22日 |
25 | 講義音声認識における講義スライド情報の利用 | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 106 | 442 | 43 | 48 | 2006年12月15日 |
26 | 話し言葉音声の音響的・言語的特徴の分析  | 電子情報通信学会技術研究報告. SP, 音声 | 106 | 78 | 19 | 24 | 2006年05月19日 |
27 | マルチバンド音声認識のためのLDAに基づく帯域重み推定手法  | 電子情報通信学会技術研究報告. SP, 音声 | 106 | 78 | 13 | 18 | 2006年05月19日 |
28 | HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価  | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 105 | 494 | 127 | 132 | 2005年12月22日 |
29 | 超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討  | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 105 | 494 | 1 | 6 | 2005年12月22日 |
30 | HMM-based speaker adaptable polyglot synthesizer - Development and evaluation 窶骭  | 情報処理学会研究報告音声言語情報処理(SLP) | 2005 | 127 | 217 | 222 | 2005年12月22日 |
31 | 超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討  | 情報処理学会研究報告音声言語情報処理(SLP) | 2005 | 127 | 91 | 96 | 2005年12月22日 |
32 | マルチストリーム話者照合におけるブースティングに基づく閥値最適化法の検討  | 情報処理学会研究報告音声言語情報処理(SLP) | 2005 | 127 | 1 | 6 | 2005年12月21日 |
33 | マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討  | 電子情報通信学会技術研究報告. SP, 音声 | 105 | 495 | 1 | 6 | 2005年12月21日 |
34 | 重要文抽出による音声自動要約手法とその客観評価法についての検討(要約, 検索, 認識・理解・対話・一般)  | 電子情報通信学会技術研究報告. SP, 音声 | 105 | 132 | 1 | 6 | 2005年06月16日 |
35 | 機械翻訳データを用いた音声認識のための言語モデル適応(多言語, CSJ, 認識・理解・対話・一般)  | 電子情報通信学会技術研究報告. SP, 音声 | 105 | 132 | 19 | 23 | 2005年06月16日 |
36 | HMMを用いた話し言葉音声合成の実現に向けての検討(一般, 一般, チュートリアルレクチャー)  | 電子情報通信学会技術研究報告. SP, 音声 | 105 | 98 | 25 | 30 | 2005年05月20日 |
37 | 多言語HMM音声合成における言語の追加 | 日本音響学会研究発表会講演論文集 | 2005 | 1 | 197 | 198 | 2005年03月08日 |
38 | マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析 | 日本音響学会研究発表会講演論文集 | 2005 | 1 | 231 | 232 | 2005年03月08日 |
39 | 講演音声のインデキシングを目的としたセグメンテーション手法の検討 | 日本音響学会研究発表会講演論文集 | 2005 | 1 | 7 | 8 | 2005年03月08日 |
40 | 客観尺度を用いた音声自動要約手法の評価 | 日本音響学会研究発表会講演論文集 | 2005 | 1 | 3 | 4 | 2005年03月08日 |
41 | 実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法  | 情報処理学会研究報告音声言語情報処理(SLP) | 2005 | 12 | 29 | 34 | 2005年02月04日 |
42 | マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討  | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 104 | 539 | 85 | 90 | 2004年12月21日 |
43 | マルチストリーム話者照合における ブースティングに基づく重み最適化法の検討  | 情報処理学会研究報告音声言語情報処理(SLP) | 2004 | 131 | 175 | 180 | 2004年12月21日 |
44 | 日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析  | 情報処理学会研究報告音声言語情報処理(SLP) | 2004 | 103 | 7 | 12 | 2004年10月22日 |
45 | 雑音に頑健な話者照合のための基本周波数情報の利用  | 情報処理学会研究報告音声言語情報処理(SLP) | 2004 | 57 | 31 | 36 | 2004年05月28日 |
46 | 雑音に頑健な話者照合のための基本周波数情報の利用  | 電子情報通信学会技術研究報告. SP, 音声 | 104 | 87 | 1 | 6 | 2004年05月21日 |
47 | マルチモーダル音声認識におけるストリーム重み係数最適化の検討  | 情報処理学会研究報告音声言語情報処理(SLP) | 2003 | 124 | 241 | 246 | 2003年12月18日 |
48 | 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識  | 情報処理学会研究報告音声言語情報処理(SLP) | 2003 | 124 | 19 | 24 | 2003年12月18日 |
49 | マルチモーダル音声認識におけるストリーム重み係数最適化の検討  | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 103 | 517 | 241 | 246 | 2003年12月11日 |
50 | 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識  | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 103 | 517 | 19 | 24 | 2003年12月11日 |
51 | 音声と耳介画像を用いたマルチモーダル個人認証  | 電子情報通信学会技術研究報告. SP, 音声 | 103 | 94 | 25 | 30 | 2003年05月30日 |
52 | 雑音に頑健な音声認識のための韻律情報の利用  | 情報処理学会研究報告音声言語情報処理(SLP) | 2003 | 58 | 55 | 60 | 2003年05月27日 |
53 | 横顔の動画像情報を用いたマルチモーダル音声認識  | 情報処理学会研究報告音声言語情報処理(SLP) | 2003 | 58 | 61 | 66 | 2003年05月27日 |
54 | 音声自動要約を利用した講演速聞きシステムの検討  | 情報処理学会研究報告自然言語処理(NL) | 2003 | 57 | 83 | 88 | 2003年05月26日 |
55 | HMM音声合成における残差駆動による自然性向上の検討 | 日本音響学会研究発表会講演論文集 | 2003 | 1 | 241 | 242 | 2003年03月18日 |
56 | マルチモーダル音声認識のための画像特徴量の改善 | 日本音響学会研究発表会講演論文集 | 2003 | 1 | 195 | 196 | 2003年03月18日 |
57 | 音声と顔画像を用いたマルチモーダル話者照合 | 日本音響学会研究発表会講演論文集 | 2003 | 1 | 107 | 108 | 2003年03月18日 |
58 | 音声と耳介画像を用いたマルチモーダル話者照合 | 日本音響学会研究発表会講演論文集 | 2003 | 1 | 109 | 110 | 2003年03月18日 |
59 | 言語モデルの教師なしバッチ型話題適応 | 日本音響学会研究発表会講演論文集 | 2003 | 1 | 129 | 130 | 2003年03月18日 |
60 | 言語モデルのバッチ型教師なし適応化法  | 情報処理学会研究報告音声言語情報処理(SLP) | 2002 | 121 | 183 | 188 | 2002年12月16日 |
61 | 言語モデルのバッチ型教師なし適応化法  | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 102 | 528 | 19 | 24 | 2002年12月13日 |
62 | 並列処理型計算機を用いた音声対話システムの検討 (テーマ:一般)  | 言語・音声理解と対話処理研究会 | 35 | | 21 | 26 | 2002年06月07日 |
63 | 雑音に頑健な基本周波数抽出法とその音声認識への適用  | 電子情報通信学会技術研究報告. EA, 応用音響 | 102 | 33 | 37 | 42 | 2002年04月19日 |
64 | 実環境におけるマルチモーダル音声認識の評価 | 日本音響学会研究発表会講演論文集 | 2002 | 1 | 151 | 152 | 2002年03月18日 |
65 | 逐次話者適応を用いた並列処理型会議音声認識システムの検討 | 日本音響学会研究発表会講演論文集 | 2002 | 1 | 105 | 106 | 2002年03月18日 |
66 | オプティカルフローを用いたマルチモーダル音声認識法の提案と評価  | 情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) | 2002 | 10 | 33 | 38 | 2002年02月01日 |
67 | HMMに基づく音声合成における様々な発話速度の実現 | 信学技報 | | | | | 2002年 |
68 | 数量化I類によるF0パターン生成の制御要因に関する検討  | 情報処理学会研究報告音声言語情報処理(SLP) | 2001 | 100 | 15 | 20 | 2001年10月19日 |
69 | ハフ変換による雑音に頑健な基本周波数抽出法  | 情報処理学会研究報告音声言語情報処理(SLP) | 2001 | 100 | 9 | 14 | 2001年10月19日 |
70 | ハフ変換を用いた雑音中の音声からの基本周波数抽出法 | 日本音響学会研究発表会講演論文集 | 2001 | 2 | 209 | 210 | 2001年10月01日 |
71 | 数量化I類を用いたピッチパターン生成における制御要因の検討 | 日本音響学会研究発表会講演論文集 | 2001 | 2 | 221 | 222 | 2001年10月01日 |
72 | オプティカルフローを用いたマルチモーダル音声認識の検討 | 日本音響学会研究発表会講演論文集 | 2001 | 2 | 27 | 28 | 2001年10月01日 |
73 | 並列処理型会議音声認識システムの検討 | 日本音響学会研究発表会講演論文集 | 2001 | 2 | 113 | 114 | 2001年10月01日 |
74 | 自由発話を対象とした対話システムの構築と評価  | 情報処理学会研究報告音声言語情報処理(SLP) | 2001 | 55 | 79 | 86 | 2001年06月01日 |
75 | 語彙制約なし音声認識へのアクセント句境界情報の利用  | 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション | 99 | 524 | 73 | 78 | 1999年12月21日 |
76 | 語彙制約なし音声認識へのアクセント句境界情報の利用  | 情報処理学会研究報告音声言語情報処理(SLP) | 1999 | 108 | 205 | 210 | 1999年12月20日 |
77 | 句境界情報を利用した語彙制約のない姓名認識 | 日本音響学会研究発表会講演論文集 | 1999 | 1 | 151 | 152 | 1999年03月01日 |
78 | モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用 | 情処研報 | | | 73 | 78 | 1999年 |
79 | モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出 | 電子情報通信学会技術研究報告. SP, 音声 | 98 | 106 | 1 | 8 | 1998年06月12日 |
80 | モーラ遷移確率モデルを用いたアクセント句の表現 | 日本音響学会研究発表会講演論文集 | 1998 | 1 | 153 | 154 | 1998年03月01日 |
81 | モーラ遷移確率モデルによる統語境界検出の改良 | 日本音響学会研究発表会講演論文集 | 1997 | 2 | 133 | 134 | 1997年09月01日 |
82 | モーラ遷移確率モデルを用いた統語境界の検出 | 電子情報通信学会技術研究報告. SP, 音声 | 97 | 114 | 33 | 40 | 1997年06月19日 |
83 | HMMによる韻律パターン表現の一手法 | 音講論 | | | 341 | 342 | 1997年 |
講演・口頭発表等 |
No. | 講演・口頭発表タイトル | 会議名 | 発表年月日 | 主催者 | 開催地 |
1 | 畳み込みニューラルネットワークを用いた運転者行動認識の性能改善の検討 | 映像情報メディア学会 メディア工学研究会 | 2023年09月07日 | | |
2 | マルチモーダル音声認識と話し言葉音声の分析 ― 古井研究室での研究の思い出 ― | 情報処理学会 音声言語情報処理研究会 | 2023年01月26日 | | |
3 | 深層学習に基づく話者照合システムに対する物真似タレントと一般人による声真似攻撃の分析 | 第12回バイオメトリクスと認識・認証シンポジウム | 2022年11月16日 | | |
4 | x-vectorに基づく話者照合システムに対する一般人と物真似タレントによる声真似攻撃の分析 | 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション | 2022年03月16日 | | |
5 | 画像処理技術を用いた部屋の片付き具合の自動推定 | 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション | 2022年03月16日 | | |
6 | 話者照合システムに対する人間と声質変換の詐称攻撃力の比較 | 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション | 2022年03月16日 | | |
7 | 隠れマルコフモデルを用いた楽曲の旋律と歌詞の自動対応推定 | 情報処理学会第83回全国大会 | 2021年03月18日 | | |
8 | 雑音の基底信号を用いた 耐雑音性の高い時間領域音声分離 | 電子情報通信学会 音声研究会 | 2021年03月03日 | | |
9 | Team Takoyaki submission for VoxCeleb Speaker Recognition Challenge 2020 | the VoxSRC Workshop 2020 | 2020年10月 | | |
10 | 実環境における自動撮影画像を対象とした畳み込みニューラルネットワークに基づく鳥類の出現検出と鳥種認識 | 映像情報メディア学会 メディア工学研究会 | 2020年02月08日 | | |
11 | 声質の類似性に基づく歌手マップの作成 | 情報処理学会全国大会講演論文集 | 2019年03月 | | |
12 | 写真スライドショー作成のための不要画像の自動検出 | 情報処理学会全国大会講演論文集 | 2019年03月 | | |
13 | 物真似タレントと素人による声真似攻撃が話者照合に与える影響の分析 | 第8回バイオメトリクスと認識・認証シンポジウム | 2018年11月 | | |
14 | 動作認識による実在確認機能を有するマルチモーダル個人認証システム | 第8回バイオメトリクスと認識・認証シンポジウム | 2018年11月 | | |
15 | Kinectを用いた実在確認機能を有するマルチモーダル個人認証システム | 電子情報通信学会技術研究報告 | 2018年03月11日 | | |
16 | 深層ニューラルネットワークを用いたフォント変換 | 電子情報通信学会総合大会 情報・システムソサイエティ特別企画学生ポスターセッション予稿集 | 2018年03月 | | |
17 | Multimodal speech recognition using mouth images from depth camera | Proceedings - 9th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2017 | 2018年02月05日 | | |
18 | ニューラルネットワークを利用した写真画像の自然物度の推定 | 電子情報通信学会技術研究報告 | 2017年09月28日 | | |
19 | 口唇深度画像を利用したディープオートエンコーダに基づくマルチモーダル音声認識 | 日本音響学会研究発表会講演論文集(CD-ROM) | 2017年09月11日 | | |
20 | プロの物真似タレントの声真似が話者照合に与える影響と音響特徴の分析 | 電子情報通信学会技術研究報告 | 2017年08月23日 | | |
21 | 口唇の深度画像を用いたディープオートエンコーダによるマルチモーダル音声認識 | 情報処理学会研究報告(Web) | 2017年07月20日 | | |
22 | 日本語楽曲の旋律と歌詞のアクセントの関係分析のための自動対応付け | 情報処理学会全国大会講演論文集 | 2017年03月16日 | | |
23 | 話者照合におけるプロの物真似タレントの声真似攻撃の影響の分析 | 情報処理学会全国大会講演論文集 | 2017年03月16日 | | |
24 | 話者認識と顔画像認識を用いた映像におけるマルチモーダル人物同定 | 日本音響学会研究発表会講演論文集(CD-ROM) | 2017年03月01日 | | |
25 | Analysis of Voice Imitation by Professional/Non-Professional Impersonators Based on Kullback–Leibler Divergence between Acoustic Models | Joint Meeting of Acoustical Society of America and Acoustic Society of Japan | 2016年11月 | | |
26 | 複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善 | 電子情報通信学会技術研究報告 | 2016年08月17日 | | |
27 | 演奏楽器の時間構造情報に基づく楽曲検索とDNNを用いた楽器演奏区間検出 | 情報処理学会研究報告(Web) | 2016年05月14日 | | |
28 | TokyoTech at MediaEval 2016 Multimodal Person Discovery in Broadcast TV task | CEUR Workshop Proceedings | 2016年01月01日 | | |
29 | 声真似が話者照合に与える影響と物真似音声の音響特徴の分析 | 電子情報通信学会 音声研究会 | 2015年 | | |
30 | An Efficient Error Correction Interface for Speech Recognition on Mobile Touchscreen Devices | 2014 IEEE Workshop on Spoken Language Technology, SLT 2014 - Proceedings | 2014年04月01日 | | |
31 | Simple Gesture-based Error Correction Interface for Smartphone Speech Recognition | Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH | 2014年01月01日 | | |
32 | 話者照合への影響を考慮した模倣音声の音響分析 | 情報処理学会 全国大会 | 2014年 | | |
33 | 口唇の深度画像を用いたマルチモーダル音声認識 | 情報処理学会 音声言語情報処理研究会 | 2014年 | | |
34 | An Efficient Error Correction Method for Smartphone Speech Recognition | 日本音響学会 秋季研究発表会 | 2014年 | | |
35 | モーラ単位音声出力を用いた発声障がい者のための会話支援システムの生成応答の評価 | 日本音響学会 春季研究発表会 | 2014年 | | |
36 | 複数スマートフォンで収録された多人数会話音声の話者決定 | 情報処理学会 全国大会 | 2014年 | | |
37 | Error Correction Using Long Context Match for Smartphone Speech Recognition | 情報処理学会 音声言語情報処理研究会 | 2014年 | | |
38 | 発声障がい者の会話支援を目的としたモーラ単位音声出力システムの開発と評価 | 第109回ヒューマンインタフェース学会研究会 | 2014年 | | |
39 | 複数スマートフォンで収録された多人数会話音声における対話グループ検出と話者決定 | 電子情報通信学会 音声研究会 | 2014年 | | |
40 | 音楽の調変化に対する相対的な色聴の分析 | 情報処理学会 全国大会 | 2013年 | | |
41 | モーラ単位音声出力を用いた発声障がい者のための会話支援システム | 日本音響学会 秋季研究発表会 | 2013年 | | |
42 | 音声認識のためのqガウス分布を用いた音響モデル | 日本音響学会 春季研究発表会 | 2013年 | | |
43 | 発声様態依存モデルを用いた話者認識 | 日本音響学会 春季研究発表会 | 2013年 | | |
44 | クラウド時代の音声情報処理 | 栢森情報科学振興財団 第13回Kフォーラム | 2013年 | | |
45 | 継続利用する話者照合システムにおける性能の経時変化に関する検討 | 情報処理学会 全国大会 | 2013年 | | |
46 | Q-Gaussian Based Spectral Subtraction for Robust Speech Recognition | 13th Annual Conference of the International Speech Communication Association 2012, INTERSPEECH 2012 | 2012年12月01日 | | |
47 | Two-pass Approach for Recognizing Code-Switching Speech | 電子情報通信学会 音声研究会 | 2012年 | | |
48 | A Compensation Technique Using q-Logarithm for Noisy Speech Recognition | 日本音響学会 春季研究発表会 | 2012年 | | |
49 | Recognition of Indonesian Code-Switching Speech | 日本音響学会 春季研究発表会 | 2012年 | | |
50 | Overlapped Speech Detection in Meeting Using Cross-Channel Spectral Subtraction and Spectrum Similarity | | 2012年 | | |
51 | クラウド時代の新しい音声研究パラダイム | 情報処理学会 音声言語情報処理研究会 | 2012年 | | |
52 | 集団共有型ロボットにおける応答の差別化による親近感向上の検討 | 情報処理学会 全国大会 | 2012年 | | |
53 | 相互スペクトル減算と振幅スペクトル相関を用いた会議音声の重畳区間検出 | 日本音響学会 春季研究発表会 | 2012年 | | |
54 | Spectral Subtraction Based on q-Gaussian Assumption for Noise Robust Speech Recognition | 日本音響学会 春季研究発表会 | 2012年 | | |
55 | 複数ピンマイクで収音された会議音声の重畳区間検出 | 情報処理学会 音声言語情報処理研究会 | 2012年 | | |
56 | Nonlinear Normalization Using q-logarithm for Robust Speech Recognition | 電子情報通信学会 音声研究会 | 2011年 | | |
57 | VAD の信頼度を利用した音声認識デコーダの検討 | 日本音響学会 秋季研究発表会 | 2010年 | | |
58 | 音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 | 電子情報通信学会 音声研究会 | 2010年 | | |
59 | 自然性と個人性に優れた音声合成のための音素継続時間長適応法 | 日本音響学会 春季研究発表会 | 2010年 | | |
60 | HMM 音声合成における自然性と個人性に優れた韻律モデル適応法の検討 | 情報処理学会 音声言語情報処理研究会 | 2010年 | | |
61 | VAD-measure-embedded Decoder with Online Model Adaptation | | 2010年 | | |
62 | An Efficient Prosody Adaptation Method and Its Application to HMM-based Speech Synthesis | | 2010年 | | |
63 | Robust Speech Recognition Using VAD-Measure-Embedded Decoder | | 2009年 | | |
64 | Generalization of Specialized On-the-fly Composition | | 2009年 | | |
65 | 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化 | 電子情報通信学会 音声研究会 | 2009年 | | |
66 | Recent Development of WFST-Based Speech Recognition Decoder | | 2009年 | | |
67 | マルチモーダル音声対話システムのための音響・画像重みの推定手法の検討 | 日本音響学会 春季研究発表会 | 2009年 | | |
68 | 立体的音像定位を利用した音声合成システムの検討 | 日本音響学会 春季研究発表会 | 2009年 | | |
69 | ハフ変換による基本周波数情報を用いた耐雑音音声認識の高性能化の検討 | 日本音響学会 春季研究発表会 | 2009年 | | |
70 | マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討 | 情報処理学会 音声言語情報処理研究会 | 2009年 | | |
71 | 話し言葉音声合成の韻律制御に関する検討 | 情報処理学会 音声言語情報処理研究会 | 2009年 | | |
72 | F0パターン生成モデルのための数量化Ⅰ類の平均値置換による話者適応法の検討 | 電子情報通信学会 音声研究会 | 2009年 | | |
73 | VAD の信頼度を利用した雑音に頑健な音声認識デコーダの検討 | 日本音響学会 秋季研究発表会 | 2009年 | | |
74 | 自然性と個人性に優れたF0 パターン適応法 | 日本音響学会 秋季研究発表会 | 2009年 | | |
75 | Development of a WFST based Speech Recognition System for a Resource Deficient Language Using Machine Translation | | 2009年 | | |
76 | Noise Robust Speech Recognition Using Spectral Subtraction and F0 Information Extracted by Hough Transform | | 2009年 | | |
77 | Analysis of Spectral Reduction and Its Effects on Speech Recognition Performance | The First Nijmegen Speech Reduction Workshop: Disappearing Sounds | 2008年 | | |
78 | An Automatic Singing Voice Evaluation Method for Voice Training | 日本音響学会 春季研究発表会 | 2008年 | | |
79 | An Analysis of Accent Effects on Mandarin Large Vocabulary Continuous Speech Recognition | 日本音響学会 春季研究発表会 | 2008年 | | |
80 | Development of a Thai Broadcast News Corpus and an LVCSR System | 日本音響学会 春季研究発表会 | 2008年 | | |
81 | Development of a Speech Recognition System for Icelandic Using Machine Translated Text | | 2008年 | | |
82 | Accent Analysis for Mandarin Large Vocabulary Continuous Speech Recognition | | 2008年 | | |
83 | Thai Broadcast News Corpus Construction and Evaluation | | 2008年 | | |
84 | Initial Evaluation of the Drivers' Japanese Speech Corpus in a Car Environment | | 2008年 | | |
85 | WFST 音声認識デコーダの高機能化とその応用 ― on-the-fly 合成法の検討 ― | 情報処理学会 音声言語情報処理研究会 | 2008年 | | |
86 | 音響的な認識誤りフレームに対するケプストラム空間拡張の効果 | 日本音響学会 秋季研究発表会 | 2008年 | | |
87 | 話し言葉音声合成における韻律制御要因の有効性の評価 | 日本音響学会 秋季研究発表会 | 2008年 | | |
88 | WFST-based Icelandic ASR Using Machine Translation | 日本音響学会 秋季研究発表会 | 2008年 | | |
89 | 音声入力によるマウスの直接操作の検討 | 日本音響学会 秋季研究発表会 | 2008年 | | |
90 | WFST デコーダにおける on-the-fly 合成の高速化に関する検討 | 日本音響学会 秋季研究発表会 | 2008年 | | |
91 | スペクトルサブトラクションとハフ変換による基本周波数情報を用いた耐雑音音声認識 | 日本音響学会 秋季研究発表会 | 2008年 | | |
92 | WFST音声認識デコーダの省メモリ化に関する検討 | 日本音響学会 春季研究発表会 | 2008年 | | |
93 | Development of a Speech Recognition System Using a Sparse Training Corpus | | 2007年 | | |
94 | 話者照合におけるマルチストリーム重みの教師なし推定法の検討 | 日本音響学会 春季研究発表会 | 2007年 | | |
95 | HMM を用いた話し言葉音声合成におけるモデルの構築とその合成音声への影響 | 日本音響学会 春季研究発表会 | 2007年 | | |
96 | スライド資料を用いた講義音声認識のための言語モデル適応 | 日本音響学会 春季研究発表会 | 2007年 | | |
97 | 対話音声を対象とした不特定話者マルチモーダル音声認識の検討 | 日本音響学会 春季研究発表会 | 2007年 | | |
98 | HMM を用いた話し言葉音声合成のためのモデルの検討 | 電子情報通信学会 音声研究会 | 2007年 | | |
99 | Development of a Speech Recognition System Using Machine Translated Data | 日本音響学会 秋季研究発表会 | 2007年 | | |
100 | 話者照合における雑音に非依存なマルチストリーム重みの検討 | 日本音響学会 秋季研究発表会 | 2007年 | | |
101 | 話し言葉音声の認識精度向上のために | 人工知能学会 AIチャレンジ研究会 | 2007年 | | |
102 | Combining Gaussian Mixture Model with Global Variance Term to Improve the Quality of an HMM-Based Polyglot Speech Synthesizer | | 2007年 | | |
103 | The Effect of Spectral Space Reduction in Spontaneous Speech on Recognition Performances | | 2007年 | | |
104 | Dynamic Language Model Adaptation Using Presentation Slides for Lecture Speech Recognition | | 2007年 | | |
105 | Acoustic and Linguistic Characterization of Spontaneous Speech | | 2007年 | | |
106 | 講義音声認識における講義スライド情報の利用 | 電子情報通信学会 音声研究会 | 2006年 | | |
107 | Why is Automatic Recognition of Spontaneous Speech So Difficult? | | 2006年 | | |
108 | New Approach to Polyglot Synthesis: How to Speak Any Language with Anyone's Voice | | 2006年 | | |
109 | A Large Vocabulary Continuous Speech Recognition System for Indonesian Language | | 2006年 | | |
110 | A Weight Estimation Method Using LDA for Multi-Band Speech Recognition | | 2006年 | | |
111 | A Stream-Weight and Threshold Estimation Method Using Adaboost for Multi-Stream Speaker Verification | | 2006年 | | |
112 | Progress on a Speaker Adaptable Polyglot Synthesizer | | 2006年 | | |
113 | Acoustic and Linguistic Characterization of Spontaneous Speech | | 2006年 | | |
114 | 野球中継番組を対象とした音響情報を用いたシーン認識 | 日本音響学会 春季研究発表会 | 2006年 | | |
115 | Development of a Dialogue System for Web Retrieval | 日本音響学会 春季研究発表会 | 2006年 | | |
116 | 話し言葉音声の音響的・言語的特徴の分析 | 電子情報通信学会 音声研究会 | 2006年 | | |
117 | マルチバンド音声認識のための LDA に基づく帯域重み推定手法 | 電子情報通信学会 音声研究会 | 2006年 | | |
118 | 話し言葉音声における音素の静的特徴量の分散と動的特徴量に関する分析 | 日本音響学会 秋季研究発表会 | 2006年 | | |
119 | Development of an Indonesian Large Vocabulary Continuous Speech Recognition System | 日本音響学会 秋季研究発表会 | 2006年 | | |
120 | プレゼンテーション蓄積検索システムにおける講義・講演音声情報を利用した適合度の改善 | 電子情報通信学会 データ工学ワークショップ | 2006年 | | |
121 | Clustering Strategies for Hidden Markov Model-Based Polyglot Synthesis | Joint Meeting of Acoustical Society of America and Acoustic Society of Japan | 2006年 | | |
122 | Toward Hidden Markov Model-Based Spontaneous Speech Synthesis | Joint Meeting of Acoustical Society of America and Acoustic Society of Japan | 2006年 | | |
123 | HMM-Based Speaker Adaptable Polyglot Synthesizer – Development and Evaluation – | 電子情報通信学会 音声研究会 | 2005年 | | |
124 | Language Model Adaptation for ASR Using Machine-Translated Data | 電子情報通信学会 音声研究会 | 2005年 | | |
125 | 重要文抽出による音声自動要約手法とその客観評価法についての検討 | 電子情報通信学会 音声研究会 | 2005年 | | |
126 | HMM を用いた話し言葉音声合成に関する検討 | 日本音響学会 秋季研究発表会 | 2005年 | | |
127 | New Approach to Cross-Language Synthesis | 日本音響学会 秋季研究発表会 | 2005年 | | |
128 | 読み上げ音声に対する話し言葉音声の言語的特徴の分析 | 日本音響学会 秋季研究発表会 | 2005年 | | |
129 | マルチストリーム話者照合におけるブースティングを用いた閾値の最適化 | 日本音響学会 秋季研究発表会 | 2005年 | | |
130 | Addition of New Languages to a Polyglot HMM-Based Synthesizer | 日本音響学会 春季研究発表会 | 2005年 | | |
131 | 客観尺度を用いた音声自動要約手法の評価 | 日本音響学会 春季研究発表会 | 2005年 | | |
132 | HMM を用いた話し言葉音声合成の実現に向けての検討 | 電子情報通信学会 音声研究会 | 2005年 | | |
133 | マルチバンド音声認識における尤度重み推定法の検討 | 日本音響学会 秋季研究発表会 | 2005年 | | |
134 | マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析 | 日本音響学会 春季研究発表会 | 2005年 | | |
135 | 講演音声のインデキシングを目的としたセグメンテーション手法の検討 | 日本音響学会 春季研究発表会 | 2005年 | | |
136 | 実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法 | 情報処理学会 音声言語情報処理研究会 | 2005年 | | |
137 | Improvement of Language Model Adaptation Using Machine-Translated Text | 日本音響学会 秋季研究発表会 | 2005年 | | |
138 | Multimodal Speaker Verification Using Ear Image Features Extracted by PCA and ICA | | 2005年 | | |
139 | Language Model Adaptation for Resource Deficient Language Using Translated Data | | 2005年 | | |
140 | Cross-Language Synthesis with a Polyglot Synthesizer | | 2005年 | | |
141 | Stream-Weight Optimization by LDA and Adaboost for Multi-Stream Speaker Verification | | 2005年 | | |
142 | Cluster-Based Modeling for Ubiquitous Speech Recognition | | 2005年 | | |
143 | Analysis of Spectral Space Reduction in Spontaneous Speech and Its Effects on Speech Recognition Performance | | 2005年 | | |
144 | Why Is the Recognition of Spontaneous Speech so Hard? | | 2005年 | | |
145 | Sentence Extraction-Based Presentation Summarization Techniques and Evaluation Metrics | | 2005年 | | |
146 | Sentence Extraction-Based Automatic Speech Summarization and Evaluation Techniques | | 2005年 | | |
147 | Toward Robust Multimodal Speech Recognition | | 2005年 | | |
148 | Speaker Adaptable Multilingual Synthesis | | 2005年 | | |
149 | Polyglot Synthesis Using a Mixture of Monolingual Corpora | | 2005年 | | |
150 | A Stream-Weight Optimization Method for Multi-Stream HMMs Based on Likelihood Value Normalization | | 2005年 | | |
151 | マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討 | 電子情報通信学会 音声研究会 | 2005年 | | |
152 | 超並列デコーダと逐次適応を用いた音声対話システム | 日本音響学会 秋季研究発表会 | 2005年 | | |
153 | 超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討 | 電子情報通信学会 音声研究会 | 2005年 | | |
154 | Noise-Robust Speech Recognition Using Multi-Band Spectral Features | The Meeting of Acoustical Society of America | 2004年 | | |
155 | 講演音声を対象とした要約手法の評価に関する検討 | 日本音響学会 秋季研究発表会 | 2004年 | | |
156 | マルチストリーム HMM における重み係数決定法に関する検討 | 日本音響学会 秋季研究発表会 | 2004年 | | |
157 | Noise-Robust Speaker Verification Using F0 Features | | 2004年 | | |
158 | 話し言葉音声認識における学習データ量と認識性能の関係 | 日本音響学会 秋季研究発表会 | 2004年 | | |
159 | A Stream-Weight Optimization Method for Audio-Visual Speech Recognition Using Multi-Stream HMMs | | 2004年 | | |
160 | マルチストリーム話者照合のためのブースティングによる重み最適化 | 日本音響学会 秋季研究発表会 | 2004年 | | |
161 | 音声と耳介画像情報を用いたマルチモーダル話者照合の高精度化 | 日本音響学会 秋季研究発表会 | 2004年 | | |
162 | Toward an HMM-Based Polyglot Synthesizer | 日本音響学会 秋季研究発表会 | 2004年 | | |
163 | 日本語話し言葉音声と読み上げ音声の音響的特徴の比較 | 日本音響学会 秋季研究発表会 | 2004年 | | |
164 | Audio-Visual Speech Recognition Using New Lip Features Extracted from Side-Face Images | | 2004年 | | |
165 | Improvement of Audio-Visual Speech Recognition in Cars | | 2004年 | | |
166 | 雑音に頑健な話者照合のための基本周波数情報の利用 | 電子情報通信学会 音声研究会 | 2004年 | | |
167 | 重要文抽出と文圧縮による音声自動要約手法の英語音声への適用 | 日本音響学会 春季研究発表会 | 2004年 | | |
168 | 周波数帯域ごとの重みつき尤度を用いた音声認識の検討 | 日本音響学会 春季研究発表会 | 2004年 | | |
169 | 尤度比最大基準によるストリーム重み最適化を用いたマルチモーダル音声認識の性能評価 | 日本音響学会 春季研究発表会 | 2004年 | | |
170 | ハフ変換による基本周波数情報を用いた雑音に頑健な話者照合 | 日本音響学会 春季研究発表会 | 2004年 | | |
171 | VoIP 携帯端末を利用した音声認証技術の検証 | 日本人間工学学会 モバイル人間工学研究部会 シンポジウム「ケータイ・カーナビの利用性と人間工学」 | 2004年 | | |
172 | マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討 | 電子情報通信学会 音声研究会 | 2004年 | | |
173 | 日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析 | 情報処理学会 音声言語情報処理研究会 | 2004年 | | |
174 | 重要文抽出と文圧縮による英語音声の自動要約 | 話し言葉の科学と工学ワークショップ | 2004年 | | |
175 | HMM 音声合成を利用したキャラクタの形状特徴に応じた音声合成法 | 日本音響学会 春季研究発表会 | 2004年 | | |
176 | 横顔画像から抽出した口唇角度情報を用いたマルチモーダル音声認識 | 日本音響学会 秋季研究発表会 | 2004年 | | |
177 | HMM 音声合成における残差駆動による自然性向上の検討 | 日本音響学会 春季研究発表会 | 2003年 | | |
178 | 音声と耳介画像を用いたマルチモーダル個人認証 | 電子情報通信学会 音声研究会 | 2003年 | | |
179 | 横顔の動画像情報を用いたマルチモーダル音声認識 | 情報処理学会 音声言語情報処理研究会 | 2003年 | | |
180 | 雑音に頑健な音声認識のための韻律情報の利用 | 情報処理学会 音声言語情報処理研究会 | 2003年 | | |
181 | 韓国人の日本語発声に対する発音誤りの自動検出・評定法 | 日本音響学会 秋季研究発表会 | 2003年 | | |
182 | 重みつきスペクトル特徴量を用いた雑音に頑健な音声認識 | 日本音響学会 秋季研究発表会 | 2003年 | | |
183 | 言語モデルの教師なしバッチ型話題適応 | 日本音響学会 春季研究発表会 | 2003年 | | |
184 | 音声と顔画像を用いたマルチモーダル話者照合 | 日本音響学会 春季研究発表会 | 2003年 | | |
185 | マルチモーダル音声認識のための画像特徴量の改善 | 日本音響学会 春季研究発表会 | 2003年 | | |
186 | 音声自動要約を利用した講演速聞きシステムの検討 | 情報処理学会 音声言語情報処理研究会 | 2003年 | | |
187 | 音声と耳介画像を用いたマルチモーダル話者照合 | 日本音響学会 春季研究発表会 | 2003年 | | |
188 | Unsupervised Class-Based Language Model Adaptation for Spontaneous Speech Recognition | | 2003年 | | |
189 | Unsupervised Language Model Adaptation Using Word Classes for Spontaneous Speech Recognition | | 2003年 | | |
190 | Noise Robust Speech Recognition Using Prosodic Information | | 2003年 | | |
191 | Audio-Visual Speech Recognition Using Lip Movement Extracted from Side-Face Images | | 2003年 | | |
192 | Audio-Visual Person Authentication Using Speech and Ear Images | | 2003年 | | |
193 | 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識 | 電子情報通信学会 音声研究会 | 2003年 | | |
194 | マルチモーダル音声認識におけるストリーム重み係数最適化の検討 | 電子情報通信学会 音声研究会 | 2003年 | | |
195 | パーソナルロボット向けの家庭内雑音に頑健な音声認識の検討 | 日本音響学会 秋季研究発表会 | 2003年 | | |
196 | マルチモーダル音声認識における音響・画像特徴の融合法に関する検討 | 日本音響学会 秋季研究発表会 | 2003年 | | |
197 | 横顔画像の口唇情報を利用したマルチモーダル音声認識 | 日本音響学会 秋季研究発表会 | 2003年 | | |
198 | 雑音に頑健な基本周波数抽出法とその音声認識への適用 | 電子情報通信学会 音声研究会 | 2002年 | | |
199 | A Robust Multi-Modal Speech Recognition Method Using Optical-Flow Analysis | | 2002年 | | |
200 | Noise Robust Speech Recognition Using F0 Contour Extracted by Hough Transform | | 2002年 | | |
201 | Speech-Rate-Variable HMM-Based Japanese TTS System | | 2002年 | | |
202 | Parallel Computing-Based Architecture for Mixed-Initiative Spoken Dialogue | | 2002年 | | |
203 | オプティカルフローを用いたマルチモーダル音声認識法の提案と評価 | 情報処理学会 音声言語情報処理研究会 | 2002年 | | |
204 | 実環境におけるマルチモーダル音声認識の評価 | 日本音響学会 春季研究発表会 | 2002年 | | |
205 | 言語モデルのバッチ型教師なし適応化法 | 電子情報通信学会 音声研究会 | 2002年 | | |
206 | ハフ変換による基本周波数情報を用いた雑音に頑健な音声認識 | 日本音響学会 秋季研究発表会 | 2002年 | | |
207 | 並列処理型計算機による混合主導型対話音声認識システムの構築 | 日本音響学会 秋季研究発表会 | 2002年 | | |
208 | HMM 音声合成における数量化Ⅰ類を用いた発話速度制御法 | 日本音響学会 秋季研究発表会 | 2002年 | | |
209 | HMM に基づく音声合成における様々な発話速度の実現 | 電子情報通信学会 音声研究会 | 2002年 | | |
210 | 並列処理型計算機を用いた音声対話システムの検討 | 人工知能学会 言語・音声理解と対話処理研究会 | 2002年 | | |
211 | 逐次話者適応を用いた並列処理型会議音声認識システムの検討 | 日本音響学会 春季研究発表会 | 2002年 | | |
212 | オプティカルフローを用いたマルチモーダル音声認識の検討 | 日本音響学会 秋季研究発表会 | 2001年 | | |
213 | Bimodal Speech Recognition Using Lip Movement Measured by Optical-Flow Analysis | | 2001年 | | |
214 | Ubiquitous Speech Processing | | 2001年 | | |
215 | Continuous Speech Recognition of Japanese Using Prosodic Word Boundaries Detected by Mora Transition Modeling of Fundamental Frequency Contours | | 2001年 | | |
216 | 並列処理型会議音声認識システムの検討 | 日本音響学会 秋季研究発表会 | 2001年 | | |
217 | ハフ変換を用いた雑音中の音声からの基本周波数抽出法 | 日本音響学会 秋季研究発表会 | 2001年 | | |
218 | 数量化Ⅰ類を用いたピッチパターン生成における制御要因の検討 | 日本音響学会 秋季研究発表会 | 2001年 | | |
219 | ハフ変換による雑音に頑健な基本周波数抽出法 | 情報処理学会 音声言語情報処理研究会 | 2001年 | | |
220 | 数量化Ⅰ類によるF0パターンの生成の制御要因に関する検討 | 情報処理学会 音声言語情報処理研究会 | 2001年 | | |
221 | 自由発話を対象とした対話システムの構築と評価 | 情報処理学会 音声言語情報処理研究会 | 2001年 | | |
222 | Detection of Prosodic Word Boundaries by Statistical Modeling of Mora Transitions of Fundamental Frequency Contours and Its Use for Continuous Speech Recognition | | 2000年 | | |
223 | モーラ遷移 HMM に基づく F0 パターンのモデル化と生成 | 日本音響学会 春季研究発表会 | 2000年 | | |
224 | Modeling and Generation of Accentual Phrase F0 Contours Based on Discrete HMMs Synchronized at Mora-unit Transitions | | 2000年 | | |
225 | Speaker-Independent Detection of Prosodic Word Boundary Using Mora Transition Modeling of Fundamental Frequency Contours | | 1999年 | | |
226 | Prosodic Word Boundary Detection Using Statistical Modeling of Moraic Fundamental Frequency Contours and Its Use for Continuous Speech Recognition | | 1999年 | | |
227 | 語彙制約なし音声認識へのアクセント句境界情報の利用 | 電子情報通信学会 音声研究会 | 1999年 | | |
228 | 句境界情報を利用した語彙制約のない姓名認識 | 日本音響学会 春季研究発表会 | 1999年 | | |
229 | タイプライタ型音声認識へのアクセント句境界情報の利用 | 日本音響学会 秋季研究発表会 | 1999年 | | |
230 | モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用 | 情報処理学会 音声言語情報処理研究会 | 1999年 | | |
231 | Prosodic Word Boundary Detection Using Mora Transition Modeling of Fundamental Frequency Contours -Speaker Independent Experiments- | | 1999年 | | |
232 | Representing Prosodic Words Using Statistical Models of Moraic Transition of Fundamental Frequency Contours of Japanese | | 1998年 | | |
233 | モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出 | 電子情報通信学会 音声研究会 | 1998年 | | |
234 | モーラ遷移確率モデルを用いたアクセント句の表現 | 日本音響学会 春季研究発表会 | 1998年 | | |
235 | Accent Type Recognition and Syntactic Boundary Detection of Japanese Using Statistical Modeling of Moraic Transitions of Fundamental Frequency Contours | | 1998年 | | |
236 | モーラ遷移確率モデルを用いた句境界検出システムの語彙制約なし音声認識への応用 | 日本音響学会 秋季研究発表会 | 1998年 | | |
237 | モーラ遷移確率モデルによる統語境界検出の改良 | 日本音響学会 秋季研究発表会 | 1997年 | | |
238 | HMM による韻律パターン表現の一手法 | 日本音響学会 春季研究発表会 | 1997年 | | |
239 | A Method of Representing Fundamental Frequency Contours of Japanese Using Statistical Models of Moraic Transition | | 1997年 | | |
240 | モーラ遷移確率モデルを用いた統語境界の検出 | 電子情報通信学会 音声研究会 | 1997年 | | |
241 | Detecting Phrase Boundaries by Low-Pass Filtering of Fundamental Frequency Contours | | 1997年 | | |
242 | Posterior Use of Prosodic Features to Aid Speech Recognition | Joint Meeting of Acoustical Society of America and Acoustic Society of Japan | 1996年 | | |
243 | Use of Prosodic Features in Speech Recognition | | 1996年 | | |