逆瀬川 Profile
逆瀬川

@gyakuse

Followers
5,447
Following
1,417
Media
277
Statuses
1,915
Explore trending content on Musk Viewer
Pinned Tweet
@gyakuse
逆瀬川
3 months
論文解説自動生成するやつ作りました! 画像として処理しているので、コスパがちょっといいです。LayoutParserを使って抽出された数式や図表の解説も自動生成されます。 解説記事: GitHub:
Tweet media one
0
104
691
@gyakuse
逆瀬川
1 year
日本語で要求される応答速度がメチャクチャ早いという話をします (滑らかな会話においては半ば被せるようにし、遅くても600ms以内に発話開始をしている)。実装においては発話終了や話者交代タイミング予測が本当につらい。
Tweet media one
@gyakuse
逆瀬川
1 year
昨日出たこの本読み終わったんですが対話システム考える上で必須くらいにいい話が大量に載ってたので超オススメです
5
477
3K
7
2K
5K
@gyakuse
逆瀬川
2 years
#NovelAI Tips: デフォルメ風のキャラ・イラストを出したいときは{{{{{{thick outline}}}}}},{{{{{{black outline}}}}}}がおすすめ。線が濃くなるだけではなく背景なども単純化される。
Tweet media one
3
633
3K
@gyakuse
逆瀬川
2 years
#ChatGPT の使い方まとめました! 質問に答えるだけじゃなくてコード生成とかキャラクターAIっぽいものもできます!
7
820
3K
@gyakuse
逆瀬川
2 years
ChatGPTでキャラっぽい返信をさせる方法! 基本的に超賢いマルコフ連鎖なので、どう喋ってほしいかというコンテキストを与えるとうまく返してくれます。根底となる考え方は思考の連鎖プロンプト(chain of thought prompting)とか調べるとよきです。
Tweet media one
Tweet media two
2
836
2K
@gyakuse
逆瀬川
2 years
#NovelAI 用の呪文生成器作りました! 呪文ガチャや作った呪文の保存、共有などができます。 結構便利に作れたと思うのでぜひ使ってみてください!
Tweet media one
7
715
2K
@gyakuse
逆瀬川
1 year
ChatGPT、普通に会話のなかで完全に理解したとか言ってくるの本当に草
Tweet media one
6
248
2K
@gyakuse
逆瀬川
1 year
GPT-3のパラメータ数とでかい丸とでかい数字を並べた図を作りました 特に意味はありません
Tweet media one
5
213
1K
@gyakuse
逆瀬川
2 years
さきほど出たChatGPT APIを使ってAIキャラクターの簡易実装をしてみました🥳 Google Colabも公開したのでぜひ使ってみてください!
3
346
1K
@gyakuse
逆瀬川
1 year
ChatGPT APIとWhisper APIを使うと会議のサマリー生成アプリを10分くらいで作れます。 Hugging Face Spaceで公開するまでの手順も書いたのでぜひ参考にしてください!
Tweet media one
7
209
1K
@gyakuse
逆瀬川
2 years
Rocket Leagueの強化学習botが上位1%のユーザーに勝利したらしい(あえてリンクは貼りません)。これは結構衝撃的で, ゲーム開発者やeスポーツ関係者にとってはチーター以上に頭痛の種になりかねない。なお, Rocket Leagueの略称がReInforcement Learningと同じRLなのはちょっと面白いです。
1
491
1K
@gyakuse
逆瀬川
2 years
ChatGPTでゲームしてて選択肢外のこと選んだらメチャクチャ怒られて草
Tweet media one
3
292
1K
@gyakuse
逆瀬川
1 year
Tweet media one
3
192
958
@gyakuse
逆瀬川
1 year
ChatGPTへの質問の際に、「段階的に考えてください」とつけるzero-shot CoTが有名だけれど、日本語環境だと「段階的に、論理的に考えてください」はさらに便利みたいな話があります(この前軽く使ってみたけど回答がより論理的になってわかりやすくなった)
0
144
958
@gyakuse
逆瀬川
1 year
GPT-4とAIキャラクター: AIのキャラクターを作るのにGPT-4はうってつけ 32k tokens上限になったことで、だいたい2.5万字(文庫50pぶん)使える。会話履歴、記憶要約、性格等の表現空間が8倍に。人間と同じ様な短期記憶はもはや実現された。VQA(画像質問回答)能力も備わり、見ているものを共有できる
6
244
918
@gyakuse
逆瀬川
1 year
Function callingを使うと一瞬で請求書等から情報抽出できるよ!って記事上げました!colabも公開しているのでぜひ使ってみてください!
Tweet media one
0
142
907
@gyakuse
逆瀬川
2 years
新しい言語モデル: LLaMA論文ちょろっと読んだ ここがみんな知りたいところだろうが、学習にかかった時間とGPUは、A100 80GB VRAM x 2048 x 21日間。 GCPのA100(3.85ドル/hour)の金額をそのまま当てると仮に民間が同程度の言語モデルを作ろうとすると学習に5.4億円程度かかる
4
258
874
@gyakuse
逆瀬川
1 year
皆さんも薄々感づいている通り、Prompt Engineeringは言語モデルが十分に発達すると人間との話し方講座やコーチング術と見分けが付かなくなります
1
194
867
@gyakuse
逆瀬川
2 years
英語論文をGoogle Colabでシュッと翻訳するやつ作って記事にしました! ぜひ使ってみてください!
Tweet media one
2
179
810
@gyakuse
逆瀬川
1 year
AITuberとか対話システムを作りたいって人が増えてると思いますが、産総研セミナーのNTT杉山さんの資料が対話システムについてメチャクチャまとまってて最高なのでぜひ読みましょう:
Tweet media one
1
194
765
@gyakuse
逆瀬川
2 years
AI VTuberをシンプルに作る方法: Talking Head Anime + GPT-3.5 API (text-davinci-003) + YouTube API + Voicebox
4
128
727
@gyakuse
逆瀬川
2 years
Whisper + GPT-3で議事録音声からの書き出しとサマリ作成の自動化ができるやつ作って公開しました! ColabのCPUないやつでも遊べるので、ぜひ使ってみてください!
Tweet media one
1
163
695
@gyakuse
逆瀬川
1 year
Qiita Technightで講演した『ChatGPTをエンジニアはどう受け止めるべきか』の資料とサマリ画像です。拡散お願いします
Tweet media one
10
151
660
@gyakuse
逆瀬川
1 year
Function callingを応用して、レシート、請求書、発注書、などなど、画像/PDFからどのような要素があるか推測し、自動で情報抽出をしてくれるシステムを作りました! Google Colabで公開しているのでぜひ使ってみてください!!オマケでGoogle Bardでも試しています。
Tweet media one
@gyakuse
逆瀬川
1 year
Function callingを使うと一瞬で請求書等から情報抽出できるよ!って記事上げました!colabも公開しているのでぜひ使ってみてください!
Tweet media one
0
142
907
2
124
663
@gyakuse
逆瀬川
1 year
GPT-4でcontextが伸びた分、AIキャラクターの説明いっぱい書けて便利という話をしましたが、どんなプロンプトを使ってるか参考までにGistに上げてみました! このプロンプトに過去の会話とか細かな各種設定等を記述すると、より自然な会話ができます
Tweet media one
Tweet media two
2
69
589
@gyakuse
逆瀬川
1 year
CSVからレポート自動作成するやつ作った! Colabで動かせるので遊んでみてください! グラフも作成してくれるので楽しいです。
Tweet media one
5
94
566
@gyakuse
逆瀬川
4 months
GPT-4oを使って食事のカロリー量を推定するやつを作りました!Huggingface Spacesにも上げているのですぐ試せます! Huggingface Space:
Tweet media one
3
198
557
@gyakuse
逆瀬川
1 year
配信者がOpenAI::Playgroundをボイスドラマ制作に使ってる事例見てビビってる、もう使いこなしてる
Tweet media one
3
126
542
@gyakuse
逆瀬川
1 year
そういえばオプトアウト申請先週ぐらいに試しにしてみたけど返信かえってきてた! ChatGPT、申請するとちゃんとオプトアウトしてくれるみたいです:
Tweet media one
@itosinitosin123
いとう!@マーケAIと人格分析AI作ってる
1 year
法人のChatGPT導入増えてると思うんですが コンシュマ向けのChatGPTでは 「入力したテキストや画像を今後サービス向上のために使用する可能性がある」
1
57
339
1
120
512
@gyakuse
逆瀬川
1 year
FactChat v1.1リリースしました🎉🎉🎉 Excel/CSVとの対話が可能になりました!
Tweet media one
2
103
455
@gyakuse
逆瀬川
1 year
GPT-4の性能を出し切ったら画像すら(そのまま)認識できるんじゃないかな〜と思ってやってみた実験です。 Incontext Learning能力の限界を探ってみるのはメチャ面白い取り組みだと思います。
3
58
430
@gyakuse
逆瀬川
2 years
契約書の差分比較を自動的に行なってリスク評価するやつ作った!GPT-3使うとこういうのも一瞬で出来たりします(精度を上げるにはプロンプトエンジニアリング等頑張る必要がある…)
Tweet media one
1
99
434
@gyakuse
逆瀬川
2 years
>長々と説明したが,第3次AIブームでは,このように若い研究者がつけた(時に幼稚な)手法名や論文名が,時折登場するが,あとで黒歴史になりがちなので,若い方は決して真似しないほうがよい. これ読んで無限に笑ってる
1
151
402
@gyakuse
逆瀬川
1 year
!?!? ChatGPTが現在日時を知ることができるようになってる!! (GPT-3.5)
Tweet media one
7
55
399
@gyakuse
逆瀬川
1 year
最近GPT-3とか使って作ったものとかまとめた! ミテネ~
2
53
396
@gyakuse
逆瀬川
2 years
DeepMindの新しい強化学習論文本当に面白かった。 AdA: Adaptive Agents 汎用エージェントの基盤となるようなアイデアが敷き詰められている。incontext learning能力によって人間と同程度、数回の試行回数で未知のタスクに適応することが可能に。
Tweet media one
1
67
382
@gyakuse
逆瀬川
1 year
○GPT-4とサービス 金額的に高いので、サービス活用はgpt-3.5-turboを引き続き使ったほうがよさそう 32k tokens(約2.5万文字、文庫で50p程度)を扱って質問-回答するのは夢があるけど毎回270円くらいかかる。ただ、プログラミングの領域だと複数モジュール渡して色々やれたり便利
3
48
373
@gyakuse
逆瀬川
2 years
英語のYouTube動画に自動で字幕を付けるやつ作りました! 英語動画に限らず、字幕付き動画を作りたいときに便利だと思います!ぜひ使ってみてください! 元動画のJoshua Davisさんに深く感謝いたします( )
0
94
353
@gyakuse
逆瀬川
1 year
LangChainの使い方について1記事にまとめようとして失敗した様子です。これからChatGPTを使ったサービス考えてる人の助けになれば!
2
52
335
@gyakuse
逆瀬川
1 year
gyumaruyaさんのこれメチャクチャすごい!!! FLAN-20B with UL2を3090で動かしてローカルでOpenAI::Playgroundみたいなことできる!民主化👊
Tweet media one
2
55
322
@gyakuse
逆瀬川
2 years
GPT-3を使って1つの単語から自動的に画像つき説明スライドを生成してくれるやつ作りました!はやりのtext to プレゼンテーションです! 今回もColabを公開しているのでぜひ遊んでください!
Tweet media one
Tweet media two
1
66
320
@gyakuse
逆瀬川
1 year
ここから発展させて、話者をアサインして書き起こしにするアプリも作りました! 話者埋め込みを使うとメッチャ面白いことできるのでゼヒ遊んでみてください!
Tweet media one
@gyakuse
逆瀬川
1 year
ChatGPT APIとWhisper APIを使うと会議のサマリー生成アプリを10分くらいで作れます。 Hugging Face Spaceで公開するまでの手順も書いたのでぜひ参考にしてください!
Tweet media one
7
209
1K
0
65
318
@gyakuse
逆瀬川
2 years
チートの高度化は, この1年で非常に目覚ましく, 背景にはyoloの登場がある。object detectionベースのチートは, 従来手法と異なり検出が難しい。多くのチートシステムはマウスドライバをハックするが, 以下では外部ハードウェアを使用しており防ぐのが困難な形になっている。
1
218
309
@gyakuse
逆瀬川
1 year
DeepFakeとCoeFontとGPT-3組み合わせたやつ!すごい!ひろゆきがSOZAIになる世界線だ…… talking headのライブラリ何使ってるのか気になる!
@ai_hirox246
AIひろゆき
1 year
🎉 #AI ひろゆき 誕生 AIひろゆきがYouTube Liveで6時間生配信を予定! あなたのコメントにAIひろゆきがお答えします!AIひろゆきは #CoeFont #ChatGPT のAI技術により作られたAIアバターです。 3/16 (木) 18:00~24:00
31
925
3K
2
65
290
@gyakuse
逆瀬川
1 year
LLM関連のよくまとまってるものとしては、Yao FuさんのHow does GPT Obtain its Ability?とWeibo AI Labの张俊林さんのzhihuでの記事がオススメです。 今年1月の時点でこれらが出てきていたのが驚きでした。
1
53
292
@gyakuse
逆瀬川
2 years
このWi-Fi版のDensePose結構面白くて, 姿勢推定の新しい地平を見せてくれている
Tweet media one
2
51
259
@gyakuse
逆瀬川
1 year
言語モデルでノーコード/ローコードでアプリが作れるようになってくるのすごい!この分野ではMake (参考: )やZapierみたいなIPaaS系サービスが伸びると思ってたけどMSやGoogleが全部やりそう:
0
65
255
@gyakuse
逆瀬川
2 years
今日はいま流行りのpdfからの論文要約自動化をOpenAIのGPT-3.5系のAPIを用いてやってみました! 要約タスクのプロンプトエンジニアリングの参考にもなるかもしれません。コードはColabで公開しているので、ぜひ試してみてください🥳
Tweet media one
0
41
250
@gyakuse
逆瀬川
1 year
ChatGPT (GPT-4) 使ったリファクタリング、雑にこんな感じにやってるけどまぁまぁ動く
Tweet media one
1
20
242
@gyakuse
逆瀬川
1 year
NTT人間情報研究所さんのこの資料本当によくて、個人的に最新動向(2)の共同埋め込みの威力と文章画像読解モデルにおけるLayoutLM(v1)から現在までの流れがわかりやすくてメチャクチャ助かる
2
36
238
@gyakuse
逆瀬川
1 year
GPT are GPTs論文で触れられているLLMを活用したアプリケーションの効率化について参考訳を貼っておきます。 LlamaIndexやLangChain::Chatを用いても実現できますが、わたしが以前書いた以下のような実装でかんたんに触れることができます:
Tweet media one
2
36
235
@gyakuse
逆瀬川
1 year
【個人的なあれ】さいきん無職ながら個人開発に集中しすぎて電気ガス水道が止まるなど完全に"""終"""になりかけており、もしバイト、ご飯のお誘い、喜捨などなどありましたら気軽にDMを送っていただけるとありがたいです…!
15
38
229
@gyakuse
逆瀬川
1 year
GPT-3.5ベースのファイル対話アプリのテスト版できた🥳🥳🥳 たぶんバグとかいっぱいあるけどためしにつかってみてください!
Tweet media one
Tweet media two
2
42
232
@gyakuse
逆瀬川
1 year
AIの進歩とつらみについて、ひさびさに真面目なポエムを書きました
Tweet media one
4
55
226
@gyakuse
逆瀬川
1 year
100k tokensに対応したClaude ( ) 使ってみた 使った資料:07/09/05 社会保障審議会年金部会第5回議事録 GPT-3のtokenizer換算で67,125tokens/45533字 ちゃんと資料の文章全体を見て要約できてる!
Tweet media one
Tweet media two
3
39
224
@gyakuse
逆瀬川
2 years
OpenAIのこのレポート, 想像以上に網羅的に検討されている. 分散型人間証明は必要になってくる技術だと思っていたが, その一つも紹介されている:
2
52
227
@gyakuse
逆瀬川
1 year
GPT-4に自分の書いたプロンプトインジェクション対策についての文章(5000字)を食わせて「embeddingを使ったプロンプトインジェクション対策について考えてみてください」と質問した例。理想の回答が返ってきてびっくりした!かみ!!!
Tweet media one
1
24
223
@gyakuse
逆瀬川
1 year
昨日はLLM Meetup Tokyo #1 にお出かけしてました! LT用の資料、10分くらいでサクッと作ったあれですが、一応貼っておきます!
3
37
223
@gyakuse
逆瀬川
1 year
・Googleの言語モデルPalmのAPIが公開予定 ・GmailやGoogle Slide、Google Documentに言語モデル搭載予定、要約や執筆等も ・Google Slideに画像生成機能追加予定
Tweet media one
Tweet media two
Tweet media three
1
44
224
@gyakuse
逆瀬川
1 year
Prompt Engineeringについてメチャクチャよくまとまってる!!
@catshun_
s-miyawaki | Algomatic
1 year
こんな内容でも誰かの役に立てばと思い 完成度 30% 程度のスライドを投下します。 追加・校正は絶賛���行中です。
5
140
951
1
35
218
@gyakuse
逆瀬川
2 years
#NovelAI Tips: 呪文生成用のWebサイトをアップデートしました🎉 ぱぱっとキャラクターを作ってみたいときにどうぞ!
1
55
206
@gyakuse
逆瀬川
2 years
ChatGPT(GPT-3.5 turbo)とWhisperのAPIが出た! しかも安い!!!(それぞれ$0.002 / 1K tokens、$0.006 /minute) text-davinci-003が$0.0200 / 1K tokensなので1/10!
1
65
204
@gyakuse
逆瀬川
1 year
@Arata_Fukoe
Arata Fukoe
1 year
たった32枚の画像でこのクオリティ… 3D Gaussian Splatting 恐るべし🤯 いよいよ実写と見分けがつかないレベルで自由視点移動が可能になってきました。 これは間違いなく映像業界に大きな影響を与えます🔥
10
1K
7K
0
35
192
@gyakuse
逆瀬川
4 months
GPT-4oで使われている新しいtokenizer、tiktokenにもう入ってる (Python では tiktokenを0.7.0 にアップデートし、enc = tiktoken.encoding_for_model("gpt-4o")とするだけ) まだOpenAI公式のtokenizerページが更新されていないので、同等の機能をもつSpaceを作りました:
Tweet media one
0
43
190
@gyakuse
逆瀬川
1 year
さいきん作った & 書いたもの一覧です! PDF翻訳機、スライド翻訳機、動画字幕生成君、スライド生成機などなど 誰かの助けになれば!
Tweet media one
Tweet media two
Tweet media three
Tweet media four
1
39
184
@gyakuse
逆瀬川
1 year
makeで自動化してる!えらい! Make, Zapier, Integrately, Automate, IFTTT等のいわゆるIPaaS(ツール連携サービス)を活用すると、気軽にChatGPT APIの恩恵得られるのでよいです。
@hiraoka_dx
平岡 | 誰も置いていかない生成AI発明家
1 year
メールが届くと、勝手に返信文章考えて、Slackに通知してくれるシステム作っちゃいました。 これからの世界は、ChatGPTが考えた返信案をコピペして、ちょっと修正して、返信するだけと。。 しかもこれ全部ノーコードだから、非エンジニアでも、無料で、30分くらいでできる。。衝撃。。
25
599
4K
1
26
180
@gyakuse
逆瀬川
2 years
#NovelAI Tips: 呪文生成用のWebサイト作りました。 ほぼ自分用のためデザインはありません。 各種タグを選ぶと下に追加されます。コピーボタンを押すとクリップボードにコピーされます。
Tweet media one
2
39
174
@gyakuse
逆瀬川
2 months
ChatPaperめちゃくちゃいい 最新の論文のtitle, abstractが翻訳されて一覧化されてて、サマリはアクセス時に (未生成の場合) リアルタイムで作成される。ChatDocに論文情報を渡して対話することもできる
1
30
176
@gyakuse
逆瀬川
1 year
そういえばうちのサービスではLlamaIndexやLangChain使ってなかったりします (前に↓の記事で書いたとおり、使う理由があんまりないため)
1
25
171
@gyakuse
逆瀬川
2 years
NVIDIAのPADL論文(言語によるキャラクターコントロール生成)の動画、非英語話���にとってありがたい速度で喋ってくれていてほんまに神 𝑩𝑰𝑮 𝑳𝑶𝑽𝑬______
0
89
172
@gyakuse
逆瀬川
2 years
NovelAIとかで作った画像貼り付けたら呪文等が一瞬で分かるやつ作りました🥳 もともとジェネレーターにくっつけてたやつですが、詳細まで分かるし単独ページなので見やすい気がします。 (Twitterで圧縮された画像等は欠損してるので見られません) #NovelAI #StableDiffusion
Tweet media one
0
57
170
@gyakuse
逆瀬川
1 year
記事とかPDFを対象にQAするやつ実装してみた! こうした実装とBing API組み合わせたりすると便利なやつ作れます。また、AITuberの実装等でも過去の記憶に埋め込み表現を用いることで長期記憶が実現できたりします。
1
37
169
@gyakuse
逆瀬川
2 months
ニコニコ動画、あんまり当事者から語られないけど初期のプロトタイプが清水 ( shi3z ) さんのUEIに発注されて布留川 ( npaka123 ) さんが開発した話すき (コメント表示のアイデアもここから)
0
43
161
@gyakuse
逆瀬川
1 year
とにかくこれなので、デカい会社には後先考えず175Bクラスの言語モデルとりあえず作ってみるみたいな行動取って欲しい気持ちでいっぱいです。
@gyakuse
逆瀬川
2 years
ここでヒント: APIに依存するとAPIがclosedになったときにすべてが崩壊するぞい
1
5
35
2
25
149
@gyakuse
逆瀬川
1 year
GPT-4くんおかしくなっちゃった…
Tweet media one
3
48
140
@gyakuse
逆瀬川
1 year
完全に理解したChatGPT、GPT-4で10回くらい間違えていた結構複雑な問題を完全に解決したし実際最強だった
0
18
142
@gyakuse
逆瀬川
2 years
#NovelAI 作ったPNGの呪文見返せる機能作りました🥳 (Twitterとかに上げた画像だと情報消されてるので見えないですが) 画像貼り付けてもアップロードされないので安全です。 ぜひ使ってみてください!
Tweet media one
2
43
137
@gyakuse
逆瀬川
1 year
GPTのトークン数改めて調べてみたけどGPT-3.5-turboとGPT-4でも若干差があった
Tweet media one
1
16
143
@gyakuse
逆瀬川
1 year
AIキャラクターの振る舞いや体験の向上を考えると言語モデルだけでなく音声合成やモーション生成、間投詞等含めた雑談対話能力などに注力する必要があって、rinnaさんはそのあたり全部抑えていて偉いという話(研究開発の方向性がメチャクチャわかりやすい):
1
16
144
@gyakuse
逆瀬川
2 years
BingGPTの威力を見るに、クローラによる情報資産の価値が大きく、MSとGoogleは収益構造の転換はあっても長期的には盤石(BingGPTのようなコストの高いサービスが安定して供給され続けるかは分からないけど)。特にGoogleはYouTubeも保有していて強い。
1
34
139
@gyakuse
逆瀬川
2 years
LLMについては, GPT-3.5がなぜこれほどうまくいっているか(RLHFなどでは説明しきれない), またなぜ同規模のLLMとの性能的乖離がありすぎるのか, を考える必要があるのだけれど, 非常に深く検討している記事. Codeが推論能力に大きく寄与しているのかもしれない.
0
27
138