山本 龍一 / Ryuichi Yamamoto Profile Banner
山本 龍一 / Ryuichi Yamamoto Profile
山本 龍一 / Ryuichi Yamamoto

@r9y9

Followers
1,836
Following
656
Media
1,920
Statuses
45,614
Explore trending content on Musk Viewer
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
「Pythonで学ぶ音声合成」本日発売です。すべてのソースコードと付録は で公開しています。音声サンプルやGoogle colabで実行できるノートブックなどは、 こちらのサイトにまとめています。ぜひ書籍と併せてご覧ください!
@dekirumonn
できるもん@インプレス
3 years
/ 『Pythonで学ぶ音声合成』発売! \ 山本龍一( @r9y9 )さん、高道慎之介( @forthshinji )さんによる『Pythonで学ぶ音声合成』が本日発売😍 Amazon「微積分・解析」カテゴリーで1位だもん🌱 すべてのソースコード、書籍に未収録の付録などはGitHubで公開中だもん✍️ #新刊 #Python #音声合成
Tweet media one
0
22
48
3
135
399
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
I have created a simple demo for singing voice synthesis (Japanese). Pre-rendered notebook: Google colab: Enjoy 😊
0
41
130
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 months
ICASSPに参加して一番考えさせられたことは、「データセットがないのでできない(やらない)」という研究がちらほらあったことである。逆に言えばデータセットが整備されたタスクで、みんな適当なmetricでSOTA争いをしているような印象を受けた。必要ならデータを作るところから始めるべきではと思った
2
28
130
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
NNSVS: Pytorchベースの研究用歌声合成ライブラリ via @r9y9 一億年ぶりにブログ書いた。絶賛開発中となっております
0
38
125
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
本日入籍done💑
14
2
116
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
これが噂の
Tweet media one
2
10
99
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
なーにが確率的勾配降下法や、絶対大域最適解保証勾配不要法にしろ
0
16
91
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
Diffusion model、お気持ちだけはわかってきた。Sonyの方の動画がめちゃくちゃ参考になった。やってみて気づいたが、実装クソ楽やな???
0
9
85
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 years
An attempt to reproduce WaveNet-based text-to-speech synthesis #mlm_kansai 先週のイベントでのLT資料公開しました。ウェーブネットに関して簡単にお話してきました
2
30
74
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 years
I'm finally done WaveNet-based text-to-speech. Uploaded samples at and prepared an on-line TTS demo supposed to be run on Google colab to help people try it easily and quickly. Hooray!
4
29
73
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
ニューラルネットの学習過程の可視化を題材に、Jupyter + Bokeh で動的な描画を行う方法の紹介 [Jupyter Advent Calendar 2017] via @r9y9 Jupyter Advent Calendar 2017 #Qiita 書きました
0
17
71
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
名古屋大学博士後期課程に合格したっぽい。#春から名大 キラキラツイートです
Tweet media one
4
4
65
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
弊チームから、日本語音声合成における句境界推定に関する論文をアップしました。デモはこちら です!
@arxiv_cscl
arXiv CS-CL
3 years
Phrase break prediction with bidirectional encoder representations in Japanese text-to-speech synthesis
0
2
9
1
15
63
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
Parallel WaveGAN 引用数300件超えているのでほめほめされたい。同じようにインパクトのある研究をまたしたい
1
2
62
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
Our paper is available on arXiv! Audio samples:
@ArxivSound
arXiv Sound
2 years
``NNSVS: A Neural Network-Based Singing Voice Synthesis Toolkit. (arXiv:2210.15987v1 []),'' Ryuichi Yamamoto, Reo Yoneyama, Tomoki Toda,
0
13
39
2
29
62
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
Pythonで学ぶ音声合成、Amazonで3カテゴリ1位やん。うれぴぃ。記録にスクショとっとこハム太郎
Tweet media one
0
15
61
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
I’m glad two our papers got accepted to ICASSP 2021 ☺️
1
1
60
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
今年のDEV DAYで音声合成について発表します
0
14
58
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
Dear speech folks, I will be presenting 4 papers about speech synthesis at #ICASSP2020 . - Parallel WaveGAN: - Improved LPCNet: - Speaker adaptation for end-to-end TTS: - ESPnet-TTS:
1
20
55
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
Pythonで学ぶ音声合成が発売されてから一年経っていた。大感謝
2
4
55
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
これで僕も音源分離のプロに😎
Tweet media one
1
5
53
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
付属の音声合成ライブラリ ttslearn をインストールすれば、数行のコードで日本語テキスト音声合成ができます。 お試しあれ😊
Tweet media one
2
23
53
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
スペクトログラムを画像として扱ってしまい大変申し訳ございません
Tweet media one
0
12
51
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
DNN音声合成のためのライブラリの紹介とDNN日本語音声合成の実装例 via @r9y9 書きました。日本語音声合成の実装例と併せて、生成結果の音声サンプルも貼りました。よろしければどうぞ。nnmnkwii
1
31
51
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
WaveNet vocoder をやってみましたので、その記録です / WaveNet: A Generative Model for Raw Audio [arXiv:1609.03499] via @r9y9 音声サンプル、知見をまとめましたので、よろしければどうぞ。
0
13
51
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
これで僕も拡散モデル完全理解者になれる…?
Tweet media one
0
2
48
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
結婚式done 夏の大感謝祭
7
2
48
@r9y9
山本 龍一 / Ryuichi Yamamoto
1 year
Pythonで学ぶ音声合成の本を読みました、本読んで音声合成始めました、と何人かに言っていただいたので、本書いて良かったなと思いました、まる
1
7
48
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 years
WN-based TTSやりました / Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions [arXiv:1712.05884] via @r9y9 最近やったことについて書きました。Taco2とDeepVoice3のabstractを読ませたサンプルを貼っています。興味のある方はどうぞ
1
22
48
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 years
わたくし、来月頭くらいにジャポンおさらばして一年間韓国にいってきます。音声合成をやりたいと思っています。みなさまよろしくお願いします😇
8
0
48
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
受賞した✌️㊗️✌️
1
5
48
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
I just made the repository public. As my hobby project, I am going to make a research tool for singing voice synthesis. I am hoping that it will be a place for open discussion. Any comments are welcome!
1
17
46
@r9y9
山本 龍一 / Ryuichi Yamamoto
10 months
Accepted to ICASSP 2024😊 See you in Seoul!🇰🇷
@r9y9
山本 龍一 / Ryuichi Yamamoto
1 year
LINE サマーインターンのレポートが公開されました!
0
5
15
1
6
47
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
両家顔合わせ、無事おわたあああああああああああああああ
0
0
47
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
いつの間にかpytorch masterにnn.Transformer 入っててワロ
0
7
43
@r9y9
山本 龍一 / Ryuichi Yamamoto
10 months
I was recognized as r9y9 several times at ASRU. It seems OSS has had more impact than published papers.
0
1
45
@r9y9
山本 龍一 / Ryuichi Yamamoto
1 year
Our new work on prompt-based text-to-speech😊 Demo:
@SythonUK
🐿️🐒🗻📚🐹
1 year
0
8
19
3
15
45
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
Parallel WaveGAN の引用数が500を超えたっぽくて very happy
0
1
44
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
Interspeech, 人生初アクセプトなので嬉しい。韓国にいるうちに成果出せてよかった…
3
0
43
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
明日彼女のご両親に挨拶をしに行きます
1
0
43
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
ESPnet-TTS: Unified, Reproducible, and Integratable Open Source End-to-End Text-to-Speech Toolkit Check our our new paper for the open-source speech processing toolkit for end-to-end TTS. Audio samples are available at 😊
2
12
39
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
"Neural text-to-speech with a modeling-by-generation excitation vocoder" This is our paper for interspeech 2020 :)
2
13
36
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
Our new work is out on arXiv! arXiv: Demo:
@ArxivSound
arXiv Sound
4 years
``Parallel waveform synthesis based on generative adversarial networks with voicing-aware conditional discriminators. (arXiv:2010.14151v1 []),'' Ryuichi Yamamoto, Eunwoo Song, Min-Jae Hwang, Jae-Min Kim,
0
2
10
0
4
40
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
拡散モデル本、確率微分方程式の知識を要求されたので号泣しています
1
6
38
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
I made ParallelWaveGAN, and people found it interesting and have made many improvements. I learn a lot from new work. I was the one who started TTS in my team, and now we have many new members and they develop new methods. I learn a lot every day. こんな感じ
0
1
38
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
Tweet media one
0
5
38
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
昔ピアノの先生をしていたマッマに生ピアノを買ってあげるという人生のミッションを1つクリアした。有意義なお金の使い���をしたと思う
1
0
38
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 months
うちのチームで、音声合成に関する研究開発のインターンを募集しています。興味のある方はぜひ応募ください。
Tweet media one
1
17
37
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
オープンソース歌声合成、誰か興味ある人いないかなぁ…チラチラ
1
10
36
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
部屋に緑が増えておしゃんになってきた
Tweet media one
2
0
36
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
Library to build speech synthesis systems designed for easy and fast prototyping. Open sourced:)
2
16
36
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
俺氏、(ネタだと思われていたような気もしますが)しばらくニートだったのですが、ようやく次のお仕事の目処がつきました。前はコンピュータビジョンを主にやっていましたが、今度は音声のお仕事になりそうです。とりあえず僕の主な生息地であるツイツタで共有をば。よかった、、、
8
0
35
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
age++
7
2
36
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
Code: PR: it took me a few hours to make my fork of DiffSinger code ready to be used with NNSVS (in a clean way!). Hope it helps those who are interested in DiffSinger/NNSVS.
0
18
36
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
I just wake up at 3am and realized that our 4 papers got accepted in ICASSP 2020! See you in Barcelona 🇪🇸
0
5
34
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
PFNのインターン落ちた〜😭😭😭 なんで私だけ😢😢みんな通ってるのに😢😢😢 やっぱ応募しなかったのがいけなかったのかな…
0
10
36
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
Tacotron: Towards End-to-End Speech Synthesis / arXiv:1703.10135 [cs.CL] via @r9y9 過去最長編になってしまった。よろしくお願い申し上げます
0
10
35
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
来月中旬頃から愛知県民になる予定なのでよろしくお願い申し上げます。大学院卒業以来なので10年振りかな。職場は変わりません。大学時代の友達(おるか???)とも会いたいな
0
3
35
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
いま一番メンテされている(俺知識)WORLDのpythonインタフェース、 pip install pyworldでインストールできるようになったので、使うといいですよ
0
17
34
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 months
We have open-sourced our annotated dataset for prompt TTS!
@ArxivSound
arXiv Sound
4 months
``LibriTTS-P: A Corpus with Speaking Style and Speaker Identity Prompts for Text-to-Speech and Style Captioning,'' Masaya Kawamura, Ryuichi Yamamoto, Yuma Shirahata, Takuya Hasumi, Kentaro Tachibana,
1
9
46
0
11
33
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
毎月3万円、奨学金を返済しているが、裕福な人はこの返済がないと考えると、人生はつらたみだなぁと思うぺこなぁ
0
2
34
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 years
In the WaveGlow paper, my WaveNet implementation is used for comparison as a best publically available WaveNet implementation.😊😊😊
1
4
32
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
博士とりたいと思います👨‍🎓目標3年以内!頑張ろうかなぁ〜
2
5
34
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
nnsvsで、学習中に音声パラメータを可視化する機能を実装した。可視化すると、いかに推定結果がスムージングされているかよくわかる。この機能の実装をはよやれという話だったんだが、面倒くさいので後回しにするという、最高に良くない事例をもう人生でn億回繰り返している。人は学ばない :cry:
Tweet media one
0
5
34
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
注文して3ヶ月、やっとソファが届いた
Tweet media one
Tweet media two
2
0
32
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
NNSVS and ENUNU's users are doing quite amazing work far beyond my original expectations. I couldn't even imagine there are non-Japanese users when I started development two years ago. I might have underestimated the potential of open-source tools for making voicebanks.
2
11
32
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
これは……
Tweet media one
0
3
33
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
彼女のご両親に挨拶done
0
0
33
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
DNN統計的音声合成ツールキット Merlin の中身を理解をする via @r9y9 かきますた。一行まとめ:ポストフィルタすごい
0
17
33
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
音声関連の修士中間発表の感想を今更ながら書くが、学術的な価値があるのかを純粋に問いただす質問で学生を詰めるようなケースが数件以上見られた。僕の元指導教員は、学生の立場になって今後どうすれば有益な研究に発展するかという視点でコメントしていて、良い先生に恵まれたのだなと思いましたまる
0
1
30
@r9y9
山本 龍一 / Ryuichi Yamamoto
4 years
一緒に音声合成の研究開発してくれる仲間ほしぃ頼む〜〜
0
10
32
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
【声質変換編】Statistical Parametric Speech Synthesis Incorporating Generative Adversarial Networks via @r9y9 よろしくお願い申し上げます
0
25
31
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
某古屋大学から受験票が届いたので、少なくとも出願チャレンジには成功したみたい
0
0
31
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
母校の名工大で講義おわた。90分話すって大変だなぁ
0
0
31
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
画面キャプチャ撮った。リアルタイムレンダリングの機能良い。調声ツール素晴らしいですね。(use_world_codec: true) が必須であることを除けば、NNSVSの音響モデル/ボコーダは全部動く。NEUTRINOのNSFを使うこともできれば、それらをmixして使うこともできる。ひとまず満足
2
19
29
@r9y9
山本 龍一 / Ryuichi Yamamoto
1 year
僕もOSSのおかげで色々声をかけてもらいましたね。コネに繋がったかは定かではないしそもそも打算なしに好きでやってただけだが、LINEの内定もらった後にNAVERからWaveNet実装見たけど興味ない?と連絡をもらったことがある。その後に韓国長期滞在の機会をゲットしたが無関係とは言い難い
0
1
30
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
誕生日とスプラ3の発売が同時にくるという、もしかして人生で最高の日か?
9
2
30
@r9y9
山本 龍一 / Ryuichi Yamamoto
6 years
はい、私がLINEの中の人です(キリッ LINE社員だけど今はNAVERで音声合成をしています
@LINE_DEV
LINE Developers
6 years
#LINE のエンジニア ってツチノコ並に居ないのでは?説を打破するため、今日中にこの投稿を引用RTして「はい、私がLINEの中の人です」などの宣言をしてくれたLINEエンジニアを、本日11/29(#いい肉の日 )にちなみ後日いい肉ランチに招待します!我こそはLINEのエンジニアだと思っている皆さん、ぜひ!
Tweet media one
Tweet media two
Tweet media three
Tweet media four
6
94
177
2
3
30
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
指輪購入done
1
0
29
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
もろた
Tweet media one
0
1
29
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
Careful data preprocessing is all you need for machine learning projects
2
5
29
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
色んな種類の天美を入手した☺️🍶
Tweet media one
0
1
28
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
自宅環境整ってきた
Tweet media one
1
1
28
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
金髪美女様に「おまっ、r9y9 !?コード使わせてもらってるよ」って言われたのでもう今日死んでもいいかもしれない
0
2
28
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
サグラダファミリア
Tweet media one
Tweet media two
Tweet media three
Tweet media four
0
0
27
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
Transformer TTS with knowledge distillation ☺️
@_akhaliq
AK
5 years
FastSpeech: Fast, Robust and Controllable Text to Speech pdf: abs: samples:
Tweet media one
1
29
77
1
6
26
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
I've released a new version of nnmnkwii . The release includes bug fixes for MLPG and support for python 3.8. I know that these days speech folks don't use the maximum likelihood parameter generation (MLPG) algorithm anymore, but here you go if you like :)
0
6
27
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
NNSVS で作られているらしいですわよ! This is a really cool demonstration of what NNSVS/ENUNU can do!
@uchuuzentai
xuu (シュー) xuu.bsky.social
2 years
tokyo smiling / 天野なおき AI 天野なおきくん、8周年おめでとうございます! 天野なおきAIを公開しました~ よろしくお願いします!! 💜✨ YouTube →  ニコニコ動画 → #NNSVS #ENUNU
3
71
150
1
4
27
@r9y9
山本 龍一 / Ryuichi Yamamoto
7 years
Speaker dependent WaveNet vocoder (的なサムシング)やってみたけ��こんなもんかね。学習データが足りないのか学習時間が足りてないのか過学習してるのか、たまにビビッっていうノイズが乗るけど、だいたい動いている感がある
0
8
27
@r9y9
山本 龍一 / Ryuichi Yamamoto
3 years
Flex scan EV2785
Tweet media one
1
0
27
@r9y9
山本 龍一 / Ryuichi Yamamoto
2 years
N某Tから転職する人はよく見る気がするが、NT某に転職する人はあまり見ない気がする。気の所為かもしれんけど
1
5
27
@r9y9
山本 龍一 / Ryuichi Yamamoto
5 years
人生一週目では到達不可能な領域があることを認めてからが人生の本番な気がしてきた
0
3
26