松浦 健太郎 Profile
松浦 健太郎

@hankagosa

Followers
10K
Following
7K
Media
125
Statuses
7K

興味:統計モデリング, 因果推論, 強化学習, Stan, R, Python, 理工学書, 仮説実験授業。技術的なブログ, 本, 論文, QAサイトの回答を書いている人が好き。なぜならそれらで独習することが多かったから。

Joined November 2012
Don't wanna be here? Send us removal request.
@hankagosa
松浦 健太郎
4 months
Rパッケージが無事CRANにリリースされました!.自動で仮想環境にpythonがインストールされて、Ray (RLlib)を通して強化学習を行って、用量反応試験において最適な患者の割りつけを計算するRパッケージです。Rの中でRayを動かすのが狂気です。.
2
44
206
@hankagosa
松浦 健太郎
3 years
Rつらい→Pythonで解決.・機械学習一貫してない→scikit-learn.・深層学習つらい→PyTorchなど.・強化学習つらい→Gym, Rayなど.・数式処理→SymPy.Pythonつらい→Rで解決.・データ加工でPandas毎回ググる→dplyr.・可視化でMatplotlib毎回ググる→ggplot.・確率分布や生存時間分析などが少ない→R全般.
1
215
1K
@hankagosa
松浦 健太郎
6 years
ヤフーのロッジ、休日めちゃ混んでる。でかい声で「ジョブス」「イノベーション」「CTO」「ハッカソン」「入賞」などが定期的に聞こえてきて心が病みそうになる。.
3
480
1K
@hankagosa
松浦 健太郎
3 years
ノーベル物理学賞、共通点は恐らくFortranなので、ノーベル賞を取りたかったらFortranやりなさいというメッセージですわい。.
6
319
976
@hankagosa
松浦 健太郎
5 years
ブログを更新しました→「西浦先生らによる実効再生産数の統計モデルを解説&拡張する試み」 - StatModeling Memorandum
3
452
982
@hankagosa
松浦 健太郎
5 years
ブログ更新しました → COVID-19 日本人の潜在的な陽性者数を推定する試み - StatModeling Memorandum
2
419
907
@hankagosa
松浦 健太郎
7 years
東山小学校→東海中→東海高→東大の経歴を持ってて、就活で東芝の面接のときに「どうして弊社を応募したのですか?」という質問に対し「全部 "東"がついてて縁起がいいと思ったらからです!」「お、おう」と面接官を圧倒してそのまま東芝に入った優秀エンジニアの先輩は元気かな?.
0
219
826
@hankagosa
松浦 健太郎
7 years
友人の少ない僕ですら、周りに離婚組が7組ぐらいあるのですが、一番面白かった離婚事由は「遺伝的多様性を高めるため」ですかね。長期的視点に立ちすぎだろ。.
0
403
802
@hankagosa
松浦 健太郎
2 years
Rのdplyrはほんと覚えやすく書きやすいので、pandasもそう書けたら嬉しいなぁと思ってたけど、polarsが書き味はだいたいdplyrでしかも高速で最高だった。移行するわ。BrainPadの_jintaさんの記事達に圧倒的感謝!.
2
165
821
@hankagosa
松浦 健太郎
2 years
RCTではなく、希望者にバランスボール使わせて効果を見てるので、交絡によるバイアスが入る典型例になっちゃってる。和歌山県大丈夫か….
6
157
791
@hankagosa
松浦 健太郎
6 years
ダメそうな本も上げておく。正規分布をこういうモッコリ分布で代用してる本はすべからくダメ。ちゃんとした正規分布を描く手間をケチるような著者の言うことなんか信用できませんわ。
Tweet media one
7
322
771
@hankagosa
松浦 健太郎
5 years
西浦先生のニコ生で出た質問、あとでnoteで回答しますー、とか言ってたけど、まじで答えまくっててビビった。.Q82!?noteやってないけどフォローしたくなった。.
0
269
563
@hankagosa
松浦 健太郎
2 years
第1話 ベイズモデリングにようこそ!!.第2話 初めてのMCMCっ!.第3話 ドキドキ!同時事後分布っ!?.第4話 ワクワク!Stan導入っ!?.第5話 ドメイン知識.第6話 憤怒.第7話 疲弊.第8話 絶望.第9話 破壊.第10話 忘却.第11話 再起.最終話 LightGBM.
0
110
527
@hankagosa
松浦 健太郎
5 years
現在京大の石岡圭一先生が東大にいた時、スペクトル法の授業を受けた。ソースコードがFortranで、自分のC言語の100倍ぐらい速くて短くてビビった。あの頃からコードはこだわろうと思ったね。.
0
68
432
@hankagosa
松浦 健太郎
5 years
p値の教育に関しては、僕の中でこれで決まりじゃんというのが最近あった。それは昨日の統計連合大会で発表されたであろう柳川先生の「p値に基づく検定の再現性」です。検定の結果の再現確率を表示するところがポイント。.
1
92
415
@hankagosa
松浦 健太郎
4 years
『生態学のための階層モデリング』いただきました。ありがとうございます!.コロナのデータ解析したい→生態学おすすめ.尖ったデータサイエンティストになりたい→生態学おすすめ.可視化うまくなりたい→生態学おすすめ.ですからね!私も数理生物学出身なのでほぼ親戚です。.
Tweet media one
0
66
416
@hankagosa
松浦 健太郎
4 years
世の中の流れには勝てず、顔出し解禁しました。生体信号処理、自然言語処理、画像処理、マーケデータ分析などが得意なデータサイエンティストの皆様ゼヒーッ.
@chugai_cc
中外製薬
4 years
デジタル戦略推進部のデータサイエンティストに、当社を選んだ理由や新しい環境の印象、実際の取り組みについて聞きました。. キャリア入社1年目のデータサイエンティストから見た中外製薬|CHUGAI DIGITAL #note.
2
74
417
@hankagosa
松浦 健太郎
7 years
わいのおすすめのデータサイエンティストになる方法:.1. ツイッターをやめて統計や機械学習の本を読む.2. ツイッターをやめてプログラミングの練習.3. ツイッターをやめてリアルのデータを解析してブログ書く.4. ツイッターをはじめてフィードバックをもらう.
0
159
411
@hankagosa
松浦 健太郎
5 years
TJOさん本人は凄くいい人で悪意はないはず。ただ、数理やコーディングの理解のあやふやさを達者な日本語でぼかしてはいけないと思う。そういう良くない部分だけを真似て、TJOさんに憧れてます!という人が周りに現れはじめて実害が出てきたので、たまに警鐘を鳴らすことにしました。.
1
76
384
@hankagosa
松浦 健太郎
7 years
その時点で少し優秀な学生を取り合うインターンよりも、社会人のためのインターンをやってほしい。2週間ぐらい有給とっても行く人は多いんじゃないかな。勧誘されてそのまま転職するもよし。ボコボコになって「あの会社は凄い会社だった…」となるのもよし。.
0
147
354
@hankagosa
松浦 健太郎
4 years
8月7日(土) 13:00-17:45 製薬×データサイエンス Meetup「なぜ今、製薬企業のデータサイエンスが 面白いのか?」という勉強会のようなイベントを催します(講演します)。評判良ければ第二回あるかも。興味ある人、参加登録をお願いします!.
1
104
365
@hankagosa
松浦 健太郎
7 years
生物がわかる人の中ではプログラミングができ、プログラミングができる人の中では数学ができ、数学がわかる人の中では生物がわかるというポジションで生きてきた。この関係を120度回転すると、各々のガチ勢に全敗やからね。久々に感じましたね。.
1
106
349
@hankagosa
松浦 健太郎
8 years
DeNAはいい人もいるけど、基本的には「不幸のデータサイエンティスト」が多くて、クソ記事でいかにSEO効果上げるか、ゲームでいかに射幸心を煽るかなどに携わる人が多い印象。料理に使うべき包丁で人を刺すのと変わらん。若い人は不幸のデータサイエンティストになることなかれ。.
1
315
340
@hankagosa
松浦 健太郎
1 year
因果推論のDAGに関する入門者向け講義ならこれがベストと思う。無料です。全コースの9割ぐらいは見ました。.
@_MiguelHernan
Miguel Hernán
1 year
"Draw your assumptions before your conclusions". 5 years ago we launched the *free* #CausalDiagrams course @HarvardOnline @edxOnline. Since then, 80,000 people in 180 countries have registered. Check it out if you want to learn about DAGs and SWIGs :.
0
49
344
@hankagosa
松浦 健太郎
8 years
『Pythonで体験するベイズ推論』(PyMC本?)頂きました。ありがとうございます!想像以上に理論と例題が丁寧です。著者が金融にも明るいらしく、5章の損失はおいくら?(ベイズ意思決定)、7章のベイズA/Bテストなどユニークな構成です。読んだ後にブログも書く予定。
Tweet media one
0
115
338
@hankagosa
松浦 健太郎
5 years
西浦先生が使っているStanコード公開されたんだね!思ったよりはシンプルで読みやすい。ニコ生で一部解説してくれるといいなぁ。.
0
162
342
@hankagosa
松浦 健太郎
5 years
因果推論を勉強したおかげで、(真は絶対に分からないけど)急所を押える統計モデリング能力はかなり重要であることを実感してます。勉強も相乗効果があると楽しいよね。こういうのをポジショントークと言って、統計モデリング沼に引き込む意図があり、フォロワーの皆さんは注意して読む必要があります。.
3
45
332
@hankagosa
松浦 健太郎
6 years
持橋先生・大羽先生による『ガウス過程と機械学習』がamazonに!和書ではなかったガウス過程の専門本。行列の微分などの初歩から補助変数法やGPLVMの説明までみっちりです。僕は2周ほどレビューのお手伝いをしました(理工学書愛がありすぎて何百件とコメントしてしまった…).
0
96
325
@hankagosa
松浦 健太郎
5 years
TJOさんのブログ記事、業界与太話や書籍写経の記事は良いと思うけど、分析やコーディングの記事は理解があやしいものが多い(ロジスティック回帰、時系列、モデルの評価など)。データサイエンス力を高めたい人は注意深く読もう。他の情報も確認しよう。.
0
73
323
@hankagosa
松浦 健太郎
3 years
Gelman先生らの『Regression and Other Stories』が個人利用で無料ダウンロードOKに。7章単回帰、13章ロジスティック回帰、締め(21章)の階層モデルはもちろん、5章シミュレーション、12章変換、16章サンプルサイズ決定、18~19章因果推論など良い章が多い。基礎の次のステップにベストな本だと思う。.
0
83
323
@hankagosa
松浦 健太郎
5 years
公的機関の公式発表の末席に突如現れた、株式会社ホクソエム。面白すぎでしょ。.
2
127
309
@hankagosa
松浦 健太郎
5 years
>RT ほんとこれ。データ解析の結果を出す場合は、モデルとセットで出す。これ約束ね。どちらのモデルが「正しい」かは議論できないけど、「そっちのモデルは〇〇を考慮してないね。考慮すると結果がだいぶ変わるけど大丈夫ですかね?」みたいな議論はできる。それが重要。.
0
89
292
@hankagosa
松浦 健太郎
3 years
昔はギラギラしてたので、大学の入学式、卒業式、成人式、葬式と全て時間の無駄と断定し全ブッチして読書してましたが、振り返ると出とけば良かったなという思いはありません。.
0
40
287
@hankagosa
松浦 健太郎
3 years
論文読むのが絶望的に遅くて、研究者の道はほぼ断念してるのだけど、藤子不二雄みたいにペンネームを使って、複数人で1人の研究者になれるんだったら実装担当を頑張りたい。プログラミング外注業者とか言わないでね。.
3
30
280
@hankagosa
松浦 健太郎
3 years
・ファッション:深層学習.・法律:自然言語処理.・医療:統計モデル、因果推論.・ロボット:強化学習.のように業界によってよく使う手法が異なるので、先に5年ぐらい興味持てる分野を決めてから、手法を深掘りして勉強するのをオススメしたいです。.
0
41
278
@hankagosa
松浦 健太郎
2 years
検定ワークフローの良くないと個人的に思ってる点はいくつかあるけど、一番は、一つ一つの検定手法は帰無仮説が真のときに第一種過誤確率が有意水準以下に抑えられているようにできているけど、こうやってつなげたときにはそれが保証されていないこと。.
@nocall_ai
nocall.ai|生成AI×架電自動化
2 years
統計的仮説検定や統計手法選択が一目でわかる👀. こういうの待ってたー!😭.
Tweet media one
Tweet media two
Tweet media three
1
47
273
@hankagosa
松浦 健太郎
6 years
生きてます。本は読んでます!.・「Pythonで学ぶ強化学習」は自分でPythonのクラスを一から作りながら学ぶところが最高です。帯の文言、いいよね。.・「たのしいベイズモデリング」は話題が面白すぎる。モデリングを試してみたくなります。
Tweet media one
0
43
262
@hankagosa
松浦 健太郎
7 years
TJOさんの何が凄いって、ここまでポジション築けてるのに間違っていることを厭わず発信し、指摘を受けてもあっさり自分のものにして知識を増やしていくところ。たしかに最短学習ルートなんだけど、普通の人間の精神じゃできない….
0
67
254
@hankagosa
松浦 健太郎
5 years
『モンテカルロ統計計算』をいただきました。理論重視の本でレベルはPRMLぐらい。ベイズ統計、乱数生成、ギブスサンプリング、HMCなどを有機的に繋ぎながら証明もある点が良かったです。出てくるRコードはシンプルで勉強になります。最強のサンプリングアルゴリズムを作って一発当てたい人も必読です!
Tweet media one
Tweet media two
1
69
267
@hankagosa
松浦 健太郎
1 year
Q「統計を学ぶ上でプログラムを動かして学ぶか、理論から学ぶかどっちがいい?」.坂巻先生A「その人の特性による。データから特徴つかんで理解を深めるのが得意な人、理論から理解を深めるのが得意な人がいる。センスない方を長々とやるのはつらいので、自分のタイプを考えよう」.良いこと言うなぁ!.
0
58
264
@hankagosa
松浦 健太郎
2 years
有意差完全保証プラン、長年p-hackingして良心の呵責に耐えかねた担当者が「ここまでヤバい宣伝したら、さすがに炎上して問題になって私も解放される!!」と考えて出てきたのでは。いままでよく頑張ったね、、もうしなくていいよ、、.
0
84
253
@hankagosa
松浦 健太郎
5 years
個人的にはCausal Inference BookのPart 1,2(特に1-2章, 3.1-3.2節, 6-8章, 11-13章, 15章)がおすすめです。.RコードもPythonコードもあります。.
0
48
252
@hankagosa
松浦 健太郎
3 years
小学三年生の国語の教科書より。②の段落を主張するには、ほけん室に来なかった人についても聞かないといかんよね?いつの間にデータサイエンス教育がここまで進んでいたか…
Tweet media one
1
62
252
@hankagosa
松浦 健太郎
1 year
本屋で若者から突然「来春からエンジニアですが、どの言語をやるかは決まってません。今勉強しといて絶対損のない本を教えて下さい」と話しかけられたので「その条件のもとならリーダブルコードかな〜」って勧めたらめちゃ感謝された。ネット情報は豊富過ぎて迷うらしいが、話しかけるのありなのか?!.
2
35
245
@hankagosa
松浦 健太郎
7 years
ブログ更新しました→「統計モデリングで癌の5年生存率データから良い病院を探す」
0
102
236
@hankagosa
松浦 健太郎
5 years
1枚目: 最尤推定の結果.2枚目: MCMCによるベイズ推定の結果(オリジナル).3枚目 .(左上): データの二度漬けやめた.(右上): そこからガンマ分布をやめて連続値用ポアソン分布(WinBUGSと同じ)を使った.(左下): そこから事前分布消した.(右下): そこから報告遅れを考慮しない.どれも大体同じ結果。
Tweet media one
Tweet media two
Tweet media three
1
71
237
@hankagosa
松浦 健太郎
2 years
無事、博士 (工学) になって卒業できました。絶対何かやらしかてる、まだ油断できない…と思って、今日のこの時間までツイートを躊躇してました….
29
11
245
@hankagosa
松浦 健太郎
7 years
某社「現在の収入を開示していただく必要はありません。しかし、オファー提示前の条件確認の際に、源泉徴収と給与明細を提示してください。」.僕「🤔」.
1
129
239
@hankagosa
松浦 健太郎
5 years
『StanとRでベイズ統計モデリング』のほとんどのコードをPython版で作成している人がいました。(exec/mcmc_tools.pyの中でpystanを使っています).ありがとうございます!.
0
60
242
@hankagosa
松浦 健太郎
9 years
最近気付いてしまったんだが、アカデミックに厳しく、院生がバタバタ死ぬ研究室を生き抜いたOB/OGがラボを持った場合、自分の研究室の院生がバタバタ死ぬことに全く抵抗がない。DVと全く同じだ…。.
2
250
215
@hankagosa
松浦 健太郎
2 years
エーザイおめでとう!サンプルサイズを約1800人にしたのはナイス手堅さ。近しい人が何人かアルツハイマー病なので素直に嬉しいです。.ただ、エーザイ史上最も小さいp値はSELECT試験(303試験)でしょ、そこを忘れちゃいかん。.(p.25より)
Tweet media one
0
62
222
@hankagosa
松浦 健太郎
7 years
発表資料です→Tokyo.R#70で「統計モデリングで癌の5年生存率データから良い病院を探す」というタイトルで話しました - StatModeling Memorandum #TokyoR.
0
82
219
@hankagosa
松浦 健太郎
3 years
検査数のキャパを考慮したモデリングで実際の感染者数やRtを推定するのをそろそろやったほうがいいのかもしれない。そして「今東京で出かけて〇〇人とすれ違うと〇〇%の確率で感染しますよ」と警告したい。.
2
53
218
@hankagosa
松浦 健太郎
6 years
独習歴の長いワイからすると、学習のコツは (1)やってて1〜2週間に1度ぐらい「おぉ!」と思えるような楽しめる対象を (2)他人と比べず焦らずに (3)少なくとも半年ぐらいは時間をかけて接する、に尽きてる。(1)の状態にならない場合はまだ早いか、性格に合ってないと見なしてとりあえず放置します。.
0
41
208
@hankagosa
松浦 健太郎
5 years
"ベイズ統計学の概論的紹介" by @nhayashi1994 #bayes #learningtheory @SlideShareさんから.
0
65
206
@hankagosa
松浦 健太郎
11 months
迷わず買った.・生態学者の統計モデリング・因果推論本は買う.・佐藤俊哉先生の本も買う.・原著が評判良ければ訳書も買う
Tweet media one
0
29
205
@hankagosa
松浦 健太郎
7 years
ブログ更新しました→「PythonのSymPyで変分ベイズの例題を理解する」 - StatModeling Memorandum
1
55
204
@hankagosa
松浦 健太郎
5 years
西浦先生らのRコードとStanコード、ほぼ理解できました。資料でよく見る図はRのoptim関数による最尤推定とprofile尤度を使って求めた信頼区間。Stanコードの統計モデルと最尤推定の統計モデルは微妙に意図が異なっていて、西浦先生の発表資料に忠実なのは最尤推定の方やね。.
0
50
202
@hankagosa
松浦 健太郎
8 years
実践ベイズモデリングきた!!凝ったモデルをグラフィカルモデルをひたすら紹介していく18章がたまらん。
Tweet media one
Tweet media two
Tweet media three
0
71
206
@hankagosa
松浦 健太郎
2 months
系列データにおける馬蹄効果の確認 #Qiitaアドカレ #Qiita @antiplasticsより . 馬蹄効果、データ行列に構造があるときにPCAすると意図せずに現れる形らしい。知らなかった。.
0
41
204
@hankagosa
松浦 健太郎
5 years
棋士の年齢効果を求めてるのすごい、面白い!今後も要チェックブログやな。."ベイズ統計モデリングを使って藤井聡太と全盛期の羽生善治を比べてみた②".
1
67
197
@hankagosa
松浦 健太郎
4 years
統計ができてもデータ解析がうまいわけではない。逆も然り。プログラミングもまた別のスキル。英語ができても翻訳がうまいわけではない。最近、そういうギャップに気をつけてメンバーを選んでる。.
0
19
197
@hankagosa
松浦 健太郎
6 years
Google翻訳、たまに数値を改ざんしてくるので楽しい。
Tweet media one
0
90
193
@hankagosa
松浦 健太郎
3 years
まだ校正が1ミリもはじまってないけど、先に書影をAmazonとかに載せて焦らせる戦略、日本だけじゃなく海外でも一緒なのか….
2
46
193
@hankagosa
松浦 健太郎
7 years
DSCの主宰者がロジスティック回帰わかってないうんぬんという話、TJOさん自身も以下の記事からはロジスティック回帰とロジスティック関数を使った非線形回帰の区別がついてないと思われるので、記事を直した方が良いと思う。.先ほどのill-identifiedさんの記事が正しい。.
0
41
189
@hankagosa
松浦 健太郎
3 years
論文が出版されました。.Matsuura K, Honda J, Hanafi IE, Sozu T, Sakamaki K. Optimal adaptive allocation using deep reinforcement learning in a dose-response study. 臨床試験において、各患者を各用量にどう割り付けるのが良いかを強化学習を用いて求める方法です。.
1
36
182
@hankagosa
松浦 健太郎
7 years
何年か前に似た案件で「趣味の分析したいんですがデータ利用申請できますか?」と某滋賀大DS関係の人に聞いたら「は?趣味で分析?ははっ、だめに決まってるでしょ。なんだよ趣味って。」って言われてから個人的な恨みがある。.
0
56
179
@hankagosa
松浦 健太郎
4 years
2年ぐらいかけてやっと論文1報出してわかった大変さ。アカデミアの皆さん、こんなシンドイことよく続けられるなぁ、尊敬の念しかない。一般人がやったら病むわ。.
2
19
185
@hankagosa
松浦 健太郎
7 years
ただRは人によってクソコードになりやすい傾向はあると思う。他の言語でやるべきfor文満載の数値計算をしたり、dplyr使わないで集計したりすると遅いし可読性がなくて地獄。そこでr-wakalangというslackに、友人のコードですけどね…とか言って投げて添削してもらうと圧倒的に成長できます。.
1
46
179
@hankagosa
松浦 健太郎
3 years
論文出版、オープンアクセスにしたらお金もらえるかと思っていたら、逆に約40万円(平均的らしい)払わなきゃいけなくてビビりました。すげーな。出版社こんなところで稼ぐんや。.
1
30
177
@hankagosa
松浦 健太郎
7 years
「Rで楽しむベイズ統計入門」読了しました。良かった点:.��例題が身近(藤井四段の連勝とか)で博識な補足が面白い.・式は割と多いが式変形が凄く丁寧.・「Rで楽しむ統計」があると2倍楽しめる.・MCMCとHMCの説明が物理出身らしく簡潔.・ジェフリーズの事前分布を推す考え方.
1
38
166
@hankagosa
松浦 健太郎
4 years
広く浅く知ってる人より一点に秀でた人が好きなので、色々勉強しようと迷っている人を見かけると「捨てるところからデータサイエンスははじまってますよ」と煽ってしまいがち。.
2
16
175
@hankagosa
松浦 健太郎
5 years
最近は因果推論の勉強をしてて、200時間超えたあたりぐらいからやっと少しずつ分かってきた気がする。新しいことを学ぶとき、はじめの数百時間は結果が多少出なくても迷わず継続的にやるしかないと思ってる。.
0
36
171
@hankagosa
松浦 健太郎
3 months
Juliaでは統計モデルからパラメータの識別可能性を自動で判定できる機能があるらしい。すご. 【第二回】非線形微分方程式系のベイズ推定 with Stan: 識別可能性とSobol感度分析|KUDO Tatsumi #zenn.
0
35
173
@hankagosa
松浦 健太郎
6 years
統計を検定からベイズモデリングに変えても、Cherry picking experimentsの類はほぼ変わらないと思うけどな。現在の形で論文の出版が評価されている限りは。ゲルマン先生のいうところの「要は結婚式であって決して結婚ではない」。.
0
58
163
@hankagosa
松浦 健太郎
5 years
hayashiさんに教えてもらい、渡辺先生の最新の講義資料のリンクをメモ。難解な箇所もありますが、第08回の資料p.18「交差検証あるいはWAICを最小化することで得られたハイパーパラメータはテスト損失を最小にしない。」など勉強になります。.
@nhayashi1994
Dr. nhayashi
5 years
これ、資料がW先生のページで公開されてるけどかなり勉強になるというか正則なときのAIC, WAICの高次漸近論とハイパラ選択の話などかなり新しい話も載ってて良い。最終話のFaQは回答が書かれてないのでどんな講義になるのかとても気になる動画みたい.
0
47
168
@hankagosa
松浦 健太郎
7 years
ブログ更新しました→「統計・数学・R関連で用途別のオススメ書籍」 - StatModeling Memorandum
0
46
170
@hankagosa
松浦 健太郎
8 years
昨日の資料をアップロードしました。→「MCMCサンプルの使い方 ~見る・決める・探す・発生させる~」 #OsakaStan5.
0
67
170
@hankagosa
松浦 健太郎
7 years
Stan開発チームから新しい論文。.Validating Bayesian Inference Algorithms with Simulation-Based Calibration ベイズ推定がうまくいってるのか判断するのは(特に複雑なモデルで)容易でないが、この手法でグラフィカルに確認でる、とのこと。
@betanalpha
\mathfrak{Michael "Shapes Dude" Betancourt}
7 years
Oh, yeah, you can also identify obstructions to a central limit theorem using that slick new SBC algorithm that all the young kids are talking about,
0
41
165
@hankagosa
松浦 健太郎
3 years
コロナのデータを用いて、Stanの微分方程式の機能を使ってmodeling (SIR model + ロックダウン)を改善していく例が論文になっています。チュートリアル論文なのでコードや図も多くあって親切でした。.
@triadsou
Triad sou.
3 years
TUTORIAL IN BIOSTATISTICS. Bayesian workflow for disease transmission modeling in Stan. Léo Grinsztajn, Elizaveta Semenova, Charles C. Margossian, Julien Riou. Statistics in Medicine.
0
37
170
@hankagosa
松浦 健太郎
7 years
出版社の編集者の「何卒、学部生のような若い方々にも読み進められるようになるべく易しく書いてくだされ〜」という依頼に対し、第一線の研究者から「元学部生のオレの経験からみて今のおまえに足りないものがある。危機感だ」みたいなガチ原稿がくるの、嫌いじゃないです。.
1
65
163
@hankagosa
松浦 健太郎
5 years
早い!! "新型肺炎COVID-19の日本の実効再生産数を推定したrstanのコードを解説してみる" - 驚異のアニヲタ社会復帰の予備
0
74
164
@hankagosa
松浦 健太郎
6 years
『入門 統計的因果推論』.Pearl先生のCausal Inference in Statisticsの翻訳。まだ未発売。前の黒木先生が訳したPearl先生の本は、冗談で黒木先生自身がdisっててウケた。こちらは内容を絞って易しめにした印象なので期待してます。.
0
42
164
@hankagosa
松浦 健太郎
5 years
ほんとこれ。データサイエンティストも全く同じやぞ。知りたいことが先にある。.
0
44
164
@hankagosa
松浦 健太郎
2 years
『Rでできるビジュアル統計学 [解析編]』をいただきました!.私自身いつかggplot2+拡張パッケージの応用の本を書きたいなぁと思っていましたが、ほぼすべて含まれた上位互換な感じでとてもおすすめです!ggplot2系以外のフォレストプロットなども載ってます。写真はぜひ使ってみたいDAGを描くところ。
Tweet media one
Tweet media two
0
26
162
@hankagosa
松浦 健太郎
5 months
西武ライオンズのデータサイエンティスト、2週間ぐらい経ってジワジワきてる。Stanでセイバーメトリクスやりてぇな。2人しかいない戦略室の人がこの募集要項を書けるの、なかなかすごいよ。何者だろ。.
1
60
162
@hankagosa
松浦 健太郎
6 years
ブログ更新しました → TensorFlowで統計モデリング - StatModeling Memorandum
0
51
158
@hankagosa
松浦 健太郎
6 years
立ち読みして面白そうだった本のメモ:.・その問題、数理モデルが解決します こういう本が好みです。読みやすく話題も面白い。.・P値 マニアックな情報が多くて良い。あの薄さだとちょっと高いかな。.
0
30
158
@hankagosa
松浦 健太郎
1 year
観察データを悪く言う気持ちも分からなくもないが、What Ifの3章のアブストに「多くの人類の知識は観察研究から導かれている。進化、プレートテクトニクス、地球温暖化、天体物理学のことを考えてごらん。」という一節があって、観察データもええなと思ったね。.
0
37
160
@hankagosa
松浦 健太郎
6 years
ArviZ ("AR-vees"と発音する) というPythonのベイズ統計モデリングの可視化ライブラリがあると知った。ベイズ統計モデリングに限らなくとも使えそうで、とても良さそう。.
0
35
159
@hankagosa
松浦 健太郎
7 months
Bayesian Data Analysis 3 (BDA3)の翻訳本『ベイズデータ解析 第3版』はいいぞ|ま #zenn.
0
51
157
@hankagosa
松浦 健太郎
4 years
ローゼンバウム統計的因果推論入門いただきました。ありがとうございます!ガチ数式だらけと思いきや、ブルーバックスのような科学的な読み物に近く、実例が面白かったです。興味ある読者向けに数式の補足もきちんとしてます。個人的にはもう少し図が欲しかったかな?是非!.
Tweet media one
Tweet media two
0
29
154
@hankagosa
松浦 健太郎
7 years
僕は欠測値の扱いと様々な集計や可視化が必要なのでR一択。深層学習ならPythonが情報が多くし書きやすい。速い数値計算ならJuliaが良さそう。要は使い分け。学ぶ場合は、今後どんな業界のどんなデータを触っていく予定なのかが重要かな、と。.
1
55
153
@hankagosa
松浦 健太郎
1 year
ブラウザで動くR、WebRが熱い!|えいつぴ #zenn.
0
43
153
@hankagosa
松浦 健太郎
4 years
データサイエンスや機械学習の流行は、データ(現実)でワイワイできることが増えて、それが成果として得られやすいからじゃないかな。理論はタイムスケールが長く簡単に成果が得られない。人が少なかろうが重要でかっこいいと思っているよ。.
0
17
150
@hankagosa
松浦 健太郎
7 years
萩原さんの「基礎からわかる時系列分析 Rで実践するカルマンフィルタ・MCMC・粒子フィルタ」はレビューを手伝いましたが、カルマンフィルタから粒子フィルタの発展的なアルゴリズムまでRでシンプルな実装があって本当に勉強になりました。痒い所にもきちんと手が届きます。.
Tweet media one
1
50
149
@hankagosa
松浦 健太郎
5 years
『社会科学のためのベイズ統計モデリング』をいただきました!数式かっちりしてるのになぜか読みやすく感じます。社会科学のモデルは非線形モデルがよく使われるようですが、その導出の式変形、KL情報量や自由エネルギーなどが非常に勉強になりました。GitHubのリポジトリ:.
Tweet media one
0
38
148
@hankagosa
松浦 健太郎
6 years
馬場さん、新刊出るんだ!.『実践Data Scienceシリーズ RとStanではじめるベイズ統計モデリングによるデータ分析入門』楽しみ。.一瞬PyStan本かと思ったらRStan本!.
1
43
152
@hankagosa
松浦 健太郎
20 days
ベイズならハザード比が変化するCox回帰をどう実装するかなぁと思って、今日ササっと実装してみたのがこちらです。.『一般化ベイズ法でハザード比が時間変化するCox回帰を実装する』.
1
18
153
@hankagosa
松浦 健太郎
5 years
このブログ、「StanとRでベイズ統計モデリング」をPyMCでひたすら実行しているのもすごいし、独自のデータ解析も面白い。.gaiaskyの技術メモ.
0
31
149