ノムオ Profile
ノムオ

@nomu_chem

Followers
4,523
Following
71
Media
68
Statuses
936

データサイエンス(機械学習)の『面白さ』・『有用性』を伝えるアカウント。フォローすると、日々、教養レベルでDX・データサイエンスに関する情報を収集できます。化学メーカー研究職。完全独学でpython・機械学習スキルを習得し、4年・1人で仕事で活用中。時に、勉強のモチベアップや、自己啓発に関する発信もします。

機械学習初学者向けの技術ブログは→
Joined June 2023
Don't wanna be here? Send us removal request.
Explore trending content on Musk Viewer
Pinned Tweet
@nomu_chem
ノムオ
4 months
「教養として知っておきたい機械学習」つ、ついに完成しました! この1冊で、ビジネスでの活用も含めて、機械学習に纏わることは、何となくイメージ掴めるかな〜と思ってます😎 私のモットーは、夜のビールの「おつまみ」程度に楽しめるものを書くです。
Tweet media one
Tweet media two
0
18
210
@nomu_chem
ノムオ
6 months
化学系のデータサイエンス(機械学習)で、「化学構造をどのように取り扱っているか」について図解してみました! 私も独学初期の頃、よくわからなかったのでこの場で整理してみます。 ・化学構造をそのまま機械学習で取り扱うことはできない。
Tweet media one
2
212
1K
@nomu_chem
ノムオ
10 months
機械学習のモデルは一先ずこれくらい勉強すればOK ・重回帰分析 ・ロジスティック回帰 ・決定木 ・ランダムフォレスト ・lightgbm 他にも色々あるけど、上の5つを理解して使えるようになればkaggleの問題も解けるし、実データの分析もできると思う。
3
84
890
@nomu_chem
ノムオ
8 months
メーカーで約3年DX(デジタル変革)を推進して思う、DXについてあんまり認知されてないこと ・DXは「プロセス」であって、それ自体では何ら価値を生み出さない ・意思決定は人間(上位者)が行うので、DX人材は鬼のプレゼン力が必要 ・DXに纏わるプレゼンをしても「?」となる。これが普通。
8
117
792
@nomu_chem
ノムオ
1 month
メーカーで約4年DX(デジタル変革)を推進して思う、DXについてあんまり認知されてないこと ・DXは「プロセス」であって、それ自体では何ら価値を生み出さない ・意思決定は人間(上位者)が行うので、DX人材は鬼のプレゼン力が必要 ・DXに纏わるプレゼンをしても「?」となる。これが普通。
3
88
632
@nomu_chem
ノムオ
10 months
データサイエンス(機械学習)で大切なことまとめ ・根本は数学 ・数式が理解できなくとも何とかなる ・データ(Xとy)を学習して、Fを構築 ・Xとyをどう設定するかが腕の見せ所 ・要件定義(何をXとyにするか)が最も大事。 ・常に利益に繋がるか徹底的に考えるべし
1
53
590
@nomu_chem
ノムオ
9 months
pythonは覚える必要はなく、理解して使えればOK 私の経験上、pythonの最もコスパの良い勉強は、 jupyternotebookでpythonコードを一行ずつ実行・出力して、コードの意味(中身)を理解すること。 実行すると、へぇこんなふうになっているんだ〜という感動で理解が早かった気がする。
0
44
581
@nomu_chem
ノムオ
1 month
化学系の研究開発で1人で約4年機械学習を活用してみて、良かったと感じること ・実験至上主義から脱却できる ・予測を試す工程(実験)まで含めて、機械学習のプロセスを全部経験 ・研究者の仕事は「目的を達成する化学構造の探索」であることを知る
1
60
567
@nomu_chem
ノムオ
6 months
データサイエンスでは、pythonはコードを覚える必要はなく、理解して使えればOK 私の経験上、pythonの最もコスパの良い勉強は、 jupyternotebookでpythonコードを一行ずつ実行・出力して、コードの意味(中身)を理解すること。
2
57
538
@nomu_chem
ノムオ
6 months
機械学習のモデルは一先ずこれくらい勉強すればOK ・重回帰分析 ・ロジスティック回帰 ・決定木 ・ランダムフォレスト ・lightgbm 他にも色々あるけど、上の5つを理解して使えるようになればkaggleの問題も解けるし、実データの分析もできると思う。
2
42
538
@nomu_chem
ノムオ
6 months
データサイエンス(機械学習)で大切なこと ・根本は数学 ・数式が理解できなくとも何とかなる ・データ(Xとy)を学習して、Fを構築。つまりy = F(X)。 ・Xとyをどう設定するかが腕の見せ所。その分野の知識・経験(ドメイン知識)が必要。 ・常に利益に繋がるか徹底的に考えるべし
1
42
490
@nomu_chem
ノムオ
4 months
私が今からデータサイエンス(機械学習)の独学を始めるなら下記流れで進める。 ・pythonの環境構築 ・kaggleのtitanic予測、住宅価格予測の記事を読み、わからないところを生成AIに全部聞きながら、取り組む。必要に応じてググって解説記事読みこむ。
0
41
470
@nomu_chem
ノムオ
4 months
研究開発でデータサイエンス(機械学習)に取り組んでて、最近感じること ・研究データは決定木系モデル(例えばLightGBM)と相性が良い。 ・制約付き最適化は至る所で使える。 ・実験計画法は全研究者にお勧めしたい。 ・重回帰分析を使いこなせていない。 ・立ち話が仕事の30%でも良い気がする。
0
36
444
@nomu_chem
ノムオ
7 months
機械学習を独学し始めた時、こんなんやる意味あるん?とか、ホンマにpythonから勉強してホンマに大丈夫かな?みたいな不安がよぎったら、この言葉を思い出してほしい。 せこい人間になるな。全知全能の神になれ。 結論、必要なものは全部勉強すればいい。
3
34
396
@nomu_chem
ノムオ
10 days
データサイエンスでは、pythonはコードを覚える必要はなく、理解して使えればOK 私の経験上、pythonの最もコスパの良い勉強は、 jupyternotebookでpythonコードを一行ずつ実行・出力して、コードの意味(中身)を理解すること。
1
34
405
@nomu_chem
ノムオ
5 months
メーカーでデータサイエンス(機械学習)をやり始めて、最初に感じた違和感が、 データサイエンスやってたら、「機械学習を使って、この課題解決できないですか?」と皆から提案されるものとばかり思っていたが、 そんなことは殆ど起こらない ということ。 「情報は自分で取りに行くもの」
0
49
373
@nomu_chem
ノムオ
2 months
データサイエンスの活用事例紹介。 データサイエンスで予測精度を向上させる際、勿論モデル側での工夫も大事だが、経験的には何より『特徴量をどのように設定するか』が最も重要だ。
Tweet media one
0
35
369
@nomu_chem
ノムオ
10 months
機械学習独学流れまとめ(私の場合) ・progate(python) ・YouTube学習(数理モデル、python) ・kaggle(titanic、住宅価格予測) ・関連書籍でさらに理解を深める ・仕事で機械学習活用 ・化学構造を取り扱う機械学習 ・LLM(langchain)←今
0
38
351
@nomu_chem
ノムオ
1 month
データサイエンス(機械学習)で大切なことまとめ ・根本は数学 ・数式が理解できなくとも何とかなる ・データ(Xとy)を学習して、Fを構築。つまりy = F(X)。 ・Xとyをどう設定するかが腕の見せ所。その分野の知識・経験(ドメイン知識)が必要。 ・常に利益に繋がるか徹底的に考えるべし
0
29
346
@nomu_chem
ノムオ
8 months
土曜日で勉強してる人も多いと思うので、仕事で機械学習を活用するまでの独学の流れ(私の場合)を紹介 ・progate(python) ・YouTube学習(数理モデル、python) ・kaggle(titanic、住宅価格予測) ・関連書籍でさらに理解を深める ・仕事で機械学習活用
0
27
332
@nomu_chem
ノムオ
6 months
化学系のデータサイエンスでは、深層学習とか使わなくても、私の経験的にはLightGBMで充分。 てかLightGBMが凄すぎる。 計算速度早いし、予測精度でるし。
3
23
323
@nomu_chem
ノムオ
8 months
kaggle等のコンペで頻出のLightGBMを使った機械学習(回帰)を実施する手順の解説記事を書きました。 前処理、モデル構築、Optunaを使ってハイパーパラメータを最適化する一連の流れを解説しています! 土曜日の「おつまみ」として良ければご活用ください!!
Tweet media one
Tweet media two
1
25
317
@nomu_chem
ノムオ
3 months
メーカーでデータサイエンス(機械学習)を活用してて思うこと ・データサイエンスに取り組んでいない人が大半で、考えることすらない。頭の片隅にもない人が殆ど。 ・udemyなどの動画教育は盛んだが、実務での応用まで考える人は中々いない
2
18
313
@nomu_chem
ノムオ
8 months
データサイエンスをやりたい人はpythonのコードをしっかり理解しておいた方がいい。 生成AIや優良な書籍が増えてきて下記が増えてきた。 ・書籍のコードそのままコピペしました ・chatgptが教えてくれたコードコピペしました
1
26
308
@nomu_chem
ノムオ
4 months
バリバリ実験化学者が研究開発で機械学習を活用できるようになるまでのロードマップ ・pythonの環境構築 ・タイタニック予測、住宅価格予測に取り組む。わからないところはプログラミング講師の生成AI先生 or 私のブログ。 ・上の2個できたら、化学構造の取り扱い方法(例えばrdkit)を勉強。
0
29
292
@nomu_chem
ノムオ
2 months
仕事で4年、ケモインフォマティクス(化学系の機械学習)を進めて感じたこと ・データ基盤が整ってないため、学習データを集めるのが1番大変。過去の資料を遡って教師データを作り込む。 ・モデル構築、予測→実験→モデル改良、予測→実験・・・のサイクルを早く回すことが何より大事
1
43
286
@nomu_chem
ノムオ
9 months
化学メーカー研究職で、1人でデータサイエンスをやっている人間の「日常」と「日々感じること」 ・希少な人材なので重宝はされる ・データサイエンスに纏わる仕事を評価できる人がいないため、評価(給与)は変わらない ・常に成果(利益)を求められる ・実験至上主義から脱却できる
1
45
280
@nomu_chem
ノムオ
1 year
データサイエンスを4年独学で勉強して、独学で1番大事だと感じたこと 「今理解できなくてもいい」 新しいこと、自分が経験したことのないことに取り組むと、最初は理解できないことが多いと思う。 pythonもそう。プログラミングをやったことない人なら、最初はわからないことだらけだと思う。
2
31
269
@nomu_chem
ノムオ
9 months
私がデータサイエンスの独学を始めたキッカケ・理由を思い出してみる。 私はメーカーで研究開発をしているアラサーだ。 そんな私がデータサイエンス(機械学習)を勉強し始めたのが4年半前。 2019年8月頃だったかな。
4
23
274
@nomu_chem
ノムオ
1 month
pythonで『化学構造』を描画してみました! rdkitを活用することでSMILES表記の化合物の化学構造を描画できます。 さて問題です。この化合物は何でしょう?😎 ヒントはこの化合物にお世話になっていない人は殆どいないと私は思ってます! この化合物の詳細はリプ欄に載せておきます〜。
Tweet media one
1
22
277
@nomu_chem
ノムオ
7 months
仕事で4年、ケモインフォマティクス(化学系の機械学習)を進めて感じたこと ・データ基盤が整ってないため、学習データを集めるのが1番大変。過去の資料を遡って教師データを作り込む。 ・モデル構築、予測→実験→モデル改良、予測→実験・・・のサイクルを早く回すことが何より大事
2
34
271
@nomu_chem
ノムオ
7 months
私の体感、データサイエンスの仕事の70%は添付の教師データを作ること。 だから機械学習の実装ができない人(pythonがわからない人)でも、添付の表を作れれば、データサイエンス(機械学習)に参画できることを是非知ってほしい!!
Tweet media one
0
13
266
@nomu_chem
ノムオ
7 months
最近、pythonのコードを叩いてゴリゴリ機械学習やりたい人だけでなく、「ビジネスでの機械学習の活用方法を知りたいだけの人」も結構多いんじゃないかと思ってる。 私自身、約4年間、メーカーの研究開発で機械学習を活用してきたが、機械学習を活用しているのは今でも私1人だ。
1
21
264
@nomu_chem
ノムオ
7 months
仕事でデータサイエンス(機械学習)を活用してわかった機械学習で大切なことまとめ ・機械学習は意思決定の手段として活用する ・数学が理解できなくとも何とかなる ・Xとyをどう設定するかが腕の見せ所 ・特にy、つまり「何を予測するか」を必死に考えるべし
2
22
256
@nomu_chem
ノムオ
11 months
データサイエンスの活用事例紹介。 データサイエンスで予測精度を向上させる際、勿論モデル側での工夫も大事だが、経験的には何より「特徴量をどのように設定するか」が最も重要だ。
Tweet media one
0
24
246
@nomu_chem
ノムオ
2 months
化学系のデータサイエンス(機械学習)で、「化学構造をどのように取り扱っているか」について図解してみました! 私も独学初期の頃、よくわからなかったのでこの場で整理してみます。 ・化学構造をそのまま機械学習で取り扱うことはできない。
Tweet media one
3
20
247
@nomu_chem
ノムオ
17 days
私がデータサイエンスの独学を始めたキッカケ・理由を書いてみる。 私はメーカーで研究開発をしているアラサーだ。 そんな私がデータサイエンス(機械学習)を勉強し始めたのが約5年前。 2019年8月頃だったかな。
1
12
244
@nomu_chem
ノムオ
1 month
pythonで、約1300個の化合物とカフェインの『化学構造の類似性』を評価してみました! 人間の目で見ても、かなり似ている化合物が得られた気がします。 化学構造が似ている、似ていないという「ある種、人間の勘みたいなもの」も化学構造をベクトル化することで定量的に評価できます。
Tweet media one
2
22
245
@nomu_chem
ノムオ
6 months
データサイエンスは、これからもっと伸びていく分野だなぁと感じてる。 4年前の決断は間違ってなかった。 弊社でも若い子達が、こぞって勉強を開始し始めたし、大学の教育や会社の研修もだいぶ手厚くなってきた印象だ。 何より勉強を始める人が多くなってきた。
0
9
222
@nomu_chem
ノムオ
6 months
仕事でデータサイエンス(機械学習)を活用し始めた当初、特にやってしまう失敗あるあるを図解してみました! 私も恥ずかしながら4年前、実際に経験しました笑 機械学習を勉強して、予測の面白さにハマると、やってしまいがちだと思ってます笑 この経験から学べるのは、
Tweet media one
1
17
213
@nomu_chem
ノムオ
10 months
データサイエンスを独学で勉強して、1人で仕事(組織)で活用してみて感じること ・普段の業務と内容が違いすぎるため、特に上位者から始めは信用されない ・信用は少しずつ得られることを知る ・成果が得られると、人は態度を変える ・組織の中ではコイツできる奴ポジションは何かと役に立つ
0
13
199
@nomu_chem
ノムオ
8 months
メーカーの研究開発で、データサイエンス(機械学習)を活用して良かったこと ・とにかくワクワクが止まらない ・データをかき集めて、pandasで読み込んだ時の達成感が堪らない ・研究者とは異なる思考のアプローチで、課題の解決に取り組むことができる
0
15
199
@nomu_chem
ノムオ
4 days
データサイエンス(機械学習)は「わかりやすい説明命」なので、約4年、全く知らない方々に説明してきて、説明資料として大事だなと思う点 ・pythonや数学の話は一切しない ・なぜ機械学習を活用するのか、必要なのか前提を説明。これがないとモデル構築する必要ある?って散々突っ込まれる。
1
96
1K
@nomu_chem
ノムオ
3 months
『重回帰分析』について思うこと ・解釈性は高いが、使いこなすのが難しい。 ・解釈性が高いので、他者への説明がしやすい(イメージしてもらいやすい)。 ・精度を上げるには、特徴量エンジニアリングを頑張るべし。
0
13
194
@nomu_chem
ノムオ
5 months
データサイエンス(機械学習)の独学で、皆一度は悩むのが「どこまで理解すべきか」だ。 結論、 「自分が責任を負っているところまで理解できればいい」 例えばlightgbmのようなフレームワークを開発している人は、数学(根本)についてきっちり理解する必要がある。
1
17
190
@nomu_chem
ノムオ
8 months
仕事で4年データサイエンス(機械学習)を活用して頭を使った点5選 ・何を予測するのか ・制約条件をどう設定するのか ・予測を簡単に試せるのかどうか ・特徴量をどう設定するか ・データをどう水増しするか 上ほど考えたし、重要なことだと思う。 マズローの欲求階層説みたいな感じ。
2
13
187
@nomu_chem
ノムオ
9 months
化学系データサイエンスあるある ・研究データは成功より失敗データの方が多い ・研究データは沢山あるが、評価法が異なるのでデータの水増しが難しい ・大体データ数は多くて100個 ・如何にデータを水増しして大きなモデルを構築できるかが鍵 ・論文から集められるのは成功データだけ
0
31
190
@nomu_chem
ノムオ
6 months
データサイエンスの魅力って、人間がデータを眺めていても何も見えてこないのに、「大量に集めてコンピュータで解析することで、見えてくるものがある」ことだと思ってる。 これが「ワクワク」する1つの要因だと思う。
0
16
185
@nomu_chem
ノムオ
8 months
データサイエンスを独学してるだけでも勝ち組だと思う。独学する過程で、データサイエンス関連のスキルに加えて、 ・ググり方をおぼえる ・新しいことに挑戦するという経験を積める ・色々な分野のデータを知れる データサイエンスを独学するなかで、こういった経験もできる。
1
12
171
@nomu_chem
ノムオ
8 months
データサイエンスの独学は継続命。 私が独学を約5年できた経験から、継続するのに大切だと感じたこと ・意図的に暇にする ・小さな成果に目を向ける ・理想は毎日勉強することだが、必ずしも毎日やる必要はない ・目標立てるのが下手であれば、目標なんて立てない方がいい ・ワクワク感を大切に
1
15
174
@nomu_chem
ノムオ
7 months
機械学習を完全独学し、会社で活用し始めて1年くらい経ち、色々な人に説明しまくる日々を送ってた時、 ふと思った。 「何でこの人たちわからないの?わからんって簡単に言い過ぎじゃない?調べろよ。」 「こんだけDXって世の中言ってるのに、何故勉強しないの?」
2
12
164
@nomu_chem
ノムオ
2 months
一般的な会社のDXの現状(私の想像) ・皆、DXという言葉はなんとなく知っている。 ・DXに向けて取り組んでる担当者がいることだけは知っているが、特に何をしているか知らない(知る必要はない)。
4
30
169
@nomu_chem
ノムオ
5 months
化学系の研究開発で1人で約4年機械学習を活用してみて、良かったと感じること ・実験至上主義から脱却できる ・予測を試す工程(実験)まで含めて、機械学習のプロセスを全部経験 ・研究者の仕事は「目的を達成する化学構造の探索」であることを知る
0
14
161
@nomu_chem
ノムオ
8 months
私がデータサイエンス関連のブログを書く理由 ・PC1つで場所を選ばず仕事してる人に憧れている ・スキル(機械学習、説明能力)を見える化したい ・承認欲求はないが、他者からの感謝が嬉しい ・データサイエンス人材の育成に興味がある ・自分の人生という時間をかけて何者かになりたい
0
8
157
@nomu_chem
ノムオ
5 months
私が研究開発でデータサイエンス(機械学習)を活用する上で、普段考えまくっていること ・何を予測するのか(ネタ探しが1番大事) ・利益貢献できそうなテーマか ・ホントに機械学習が必要なのか、人間では無理なのか ・そのテーマをすることで他のテーマへの横展開に繋がるか ・成功確率は高そうか
1
12
155
@nomu_chem
ノムオ
8 months
機械学習スキル+αがあれば理想だけど、「機械学習スキルだけ」でも全然問題ない。 てか需要ありまくりだと思う。 メーカーで研究開発やってるけど、ちゃんと理論を理解してる人(ドメイン知識がある人)なんて少数だし、大学で学んだ分野の仕事をしてる人なんて少数だ。
3
8
151
@nomu_chem
ノムオ
6 months
仕事でデータサイエンスをやり始めて、機械学習のハイパーパラメータの調整なんかより、ずっと意識してるのが「学習データの範囲」 学習データが、予測したい範囲をカバーできているのかは常に考えている。
1
11
146
@nomu_chem
ノムオ
11 months
メーカーでデータサイエンスやっているが、その通りだと思う。 対話力も求められる。上の人にデータサイエンスってどんなもんか理解してもらう必要があるし。 あと対話力がないと仲間も集まらない。 そして何より問題を作る能力が重要。 その分野の深い知識・経験がないと「良い問題」が作れない。
@Ayumu_walker
walker@Data Scientist & Quantum Computing Engineer
11 months
データサイエンティストなんて、データの活用がメインで事業にまで口を出すようなコンサルの亜種だから、機械学習エンジニアみたいなタスク特化型と比べたら人と喋る時間が多いだろうね。 Kaggleのモデルを作るのが主軸ではなく、Kaggleの問題を作ることとその結果を活用することが本業だからね
0
28
198
0
22
146
@nomu_chem
ノムオ
8 months
データサイエンス(機械学習)の独学でずっと考えているのが「どこまで理解すべきか」問題。 結論、全部理解できるのが理想なんだけど、まずは「自分が責任を負っているところまで理解できればいい」と思っている。
1
14
146
@nomu_chem
ノムオ
9 months
私のブログの「機械学習モデルの解説記事」読まれてるランキング 1位 重回帰分析 2位 LightGBM 3位 ロジスティック回帰 4位 決定木 5位 ランダムフォレスト やはり重回帰分析は人気なんだなぁ〜 個人的にはLightGBM使いまくってるので、LightGBMが2位なのは嬉しい😆
@nomu_chem
ノムオ
9 months
私のツイートで最も反響のあった下記ツイートを基に、機械学習モデルのまとめ記事を書きました。 土曜日のゆっくりした時間の「おつまみ」として良ければどうぞ!
Tweet media one
Tweet media two
1
8
81
0
10
146
@nomu_chem
ノムオ
6 months
データサイエンスでpythonコードを覚えなくていい理由 デーサイエンスでは分析・予測することが目的で、コードの開発をするわけではない。 だからpythonは、あくまで「手段」に過ぎない。 データサイエンスで扱うpythonコードは、皆に共通してるコードが多く、ググると殆ど出てくる。
1
11
143
@nomu_chem
ノムオ
5 months
データサイエンス(機械学習)を仕事で約4年1人でやってみた感想としては、「誰もやってない」はチャンスなんだなぁと感じている。 始めた当初はそんなこと思ってなかったけど、振り返ってみてそう感じる。
1
6
139
@nomu_chem
ノムオ
1 month
メーカーでのDX推進に対して、これだけ反響があるのは、やはり同じような悩みを抱えている人が多いからだと感じる。 ・1人では決してDXを推進できない ・組織におけるDX推進では、特に決裁を下す側のリテラシーが重要 ・お互いが協力しあい目的を達成しようとする企業風土
0
18
141
@nomu_chem
ノムオ
5 months
データサイエンスの人材育成あるある ・本人のやる気命 ・仕事の時間のみで教えきるのは不可能 ・教える側、教えられる側、共に頭がパンクする ・わからないながらも自分で調べる・質問してくる人は成長が早いし支援したくなる ・pythonがやはりネック(本人が実行して使い方を覚えるしかない)
0
13
134
@nomu_chem
ノムオ
6 months
メーカーでデータサイエンスをやってて思うのは、pythonや統計などに加えて、プレゼン力や他者理解みたいなものがかなり求められるということ。
1
6
137
@nomu_chem
ノムオ
6 months
デーサイエンス(機械学習)を勉強している or 勉強したい人は、 データサイエンスの「自分なりの面白さ」を探してみることお勧めする。 データサイエンスを勉強し始めるキッカケは、「社会で役に立つスキルが欲しい」とか「転職して給与を上げたい」とか、色々な理由があると思うが、
1
6
136
@nomu_chem
ノムオ
3 months
会社でデータサイエンス(機械学習)の人材育成やってるけど、たまに初学者でanaconda使ってない人がいるんだけど、 計算環境の構築はひとまず「anaconda」をインストールすべし。 てか一択。 最初からよく使うライブラリも入ってて、ラク。
0
7
135
@nomu_chem
ノムオ
4 months
メーカーでデータサイエンス(機械学習)を1人で4年やってみて感じるのが、結局、「信用が大切」なんだなと。 データサイエンスの様々な手法を駆使して、予測精度を上げたり、その結果として、「予測が当たる or 当たらない」も勿論大事だけど、 それと同じくらい貴方が信用されてるか?が大事。
0
18
133
@nomu_chem
ノムオ
8 months
サラリーマンとして働きつつ、データサイエンスの独学で大変だったことと乗り越える方法 ・勉強する必要ある?という悪魔の囁き ・身近にデータサイエンスに詳しい人がない ・どの程度勉強したら仕事で使えるかわからない ・月〜金働いてるのに、土・日勉強し続けると俺の人生何?ってなる
0
9
131
@nomu_chem
ノムオ
3 months
私のデータサイエンス初学者時代の最大の悩みは、データサイエンスの「全体像」が全く見えなかったこと。 そもそも仕事をしてる想像がつかない。 営業職→お客さんに商品の良さをPRして商品を売る仕事 研究者→お客さんの満足する商品を世の中に出す仕事 機械学習を活用してる人→??
@nomu_chem
ノムオ
4 months
「教養として知っておきたい機械学習」つ、ついに完成しました! この1冊で、ビジネスでの活用も含めて、機械学習に纏わることは、何となくイメージ掴めるかな〜と思ってます😎 私のモットーは、夜のビールの「おつまみ」程度に楽しめるものを書くです。
Tweet media one
Tweet media two
0
18
210
0
7
132
@nomu_chem
ノムオ
13 days
研究開発のデータサイエンスあるある ・複数のパラメータを同時に振って実験していないため、説明変数の分散が小さい ・ほとんど0の説明変数がある ・殆どの場合、多重共線性あり ・研究データは偏りがあるのが当たり前 ・重回帰などの線形モデルより木構造のモデルの方が精度でやすい
1
6
131
@nomu_chem
ノムオ
6 months
未経験から独学で機械学習を勉強し、仕事で活用し始めた人にお伝えしたいのが、 pythonでエラーがでてその日に対処できなさそうな場合は、家に持ち帰って調べて、次の日、調べたコードでエラーに対処する感じで良いと思う。
3
11
125
@nomu_chem
ノムオ
7 months
最近はデータサイエンスの独学について発信していますが、独学の流れは下記のような感じかなと思う。
0
11
124
@nomu_chem
ノムオ
8 months
4.5年前からデータサイエンスの独学をしているが、勉強しなきゃ・しなきゃと焦りを感じている時は要注意。 まず前提として、勉強はしたい時にすればいい ということを忘れないでほしい。
2
4
123
@nomu_chem
ノムオ
9 months
私のブログの「機械学習モデルの解説記事」読まれてる回数ランキング(公開から1か月時点) 1位 重回帰分析 172 2位 LightGBM 163 3位 ロジスティック回帰 90 4位 決定木 68 5位 ランダムフォレスト 56 だいぶLightGBMが追い上げてきて、重回帰分析に迫ってきました!
@nomu_chem
ノムオ
9 months
私のブログの「機械学習モデルの解説記事」読まれてるランキング 1位 重回帰分析 2位 LightGBM 3位 ロジスティック回帰 4位 決定木 5位 ランダムフォレスト やはり重回帰分��は人気なんだなぁ〜 個人的にはLightGBM使いまくってるので、LightGBMが2位なのは嬉しい😆
0
10
146
0
6
125
@nomu_chem
ノムオ
6 months
仕事でデータサイエンス(機械学習)を活用して、色々失敗して気づいたのが、 「予測はあくまで予測」というお話。 「予測を基に意思決定して行動」することで初めて予測が価値を生み出す。 予測だけでは価値を生み出さない。 予測することが目的になっちゃうんですよね最初は。。
Tweet media one
0
13
120
@nomu_chem
ノムオ
5 months
データサイエンスを学ぶということは、数学やpythonを勉強することだけど、 ビジネスでデータサイエンスを活用するという点では、上記に加えて、 要件定義力 ビジネス戦闘力(ビジネスに対する理解) プレゼン能力 人間力・調整力(他者や組織についての理解) 等も必要になってくる。
0
7
121
@nomu_chem
ノムオ
3 months
データサイエンスはこれからもっと伸びていく分野なんだけど、全く精通してない人に有用性を伝えるのが難しい。。 んー、モヤモヤした日々😑 私と同じようない人いないですかね? モヤモヤしてないですか?笑 いや研究開発ほど機械学習を活用できる分野ないで。と内心思いつつ、
4
1
120
@nomu_chem
ノムオ
2 months
データサイエンスを独学してるだけでも勝ち組だと思う。独学する過程で、データサイエンス関連のスキルに加えて、 ・ググり方をおぼえる ・新しいことに挑戦するという経験を積める ・色々な分野のデータを知れる データサイエンスを独学するなかで、こういった経験もできる。
1
6
116
@nomu_chem
ノムオ
6 months
ゴールデンウイーク明けの金晩ということで、私がデータサイエンスの独学を始めたキッカケ・理由を思い出してみる。 私がデータサイエンス(機械学習)を勉強し始めたのが約4年半ほど前。 2019年8月頃だったかな。
2
6
114
@nomu_chem
ノムオ
9 months
データサイエンティストのキャリア戦略について考えてみる。 今データサイエンスとは関係がない専門の仕事をしつつ、pythonを活用したデータサイエンス(機械学習)を仕事で活用したい・している人が対象だ。 1年目→独学 2年〜5年→仕事でデータサイエンスを活用
0
12
111
@nomu_chem
ノムオ
10 months
2024年になって目標や計画を立ててる人も多いと思うが、機械学習の独学を考えている人には、とにかく「肩の力を抜くこと」をオススメする。 機械学習は勉強する項目が多い。 ・python(プログラミング) ・モデルの理解(数学) ・統計学(マストではないがベター)
1
5
108
@nomu_chem
ノムオ
9 months
今日は少しデータサイエンスを独学をし始めた当初を振り返ってみようと思う。 pythonを独学し始めた当初はググり方も知らなければ、何がわからないかわからないくらいわからないことだらけだった。 ググった結果出てくるpythonのプログラムが難関大学の英語長文のように見えた。
0
8
105
@nomu_chem
ノムオ
2 months
未経験からデータサイエンス(機械学習)を独学して印象が変わったこと ・プログラミング  コードを暗記して叩きまくってる印象だったが、実際は、ググってコピペして編集。そして理解したコードを別のテーマにも転用。 ブラッディマンデイの高木藤丸をイメージしていたが、全然違う笑
0
8
106
@nomu_chem
ノムオ
6 months
データサイエンス初学時に知りたかったのが、「面白さがわかるには時間がかかる」ということ。 私は完全独学でデータサイエンスを勉強したんで、本当の独学初期は面白さが全くわからなかった。 プログラミングなんてやったことなかったし、ググるとコードが難関大学の英語長文みたいに見えるし。
0
4
105
@nomu_chem
ノムオ
9 months
サラリーマンとして働きつつ、独学でデータサイエンスの勉強をしていたが、最初は中々勉強が思うように進まなかった。その中で私が徹底したことを振り返っていこうと思う。長文となるが、特に20代の皆さんに伝えたい。
0
9
102
@nomu_chem
ノムオ
2 months
【データサイエンス(機械学習)を高校生でもわかるように解説してみる】 住宅価格を予測する場合を例に、機械学習の最も一般的な「教師あり学習」について解説していく。 先ずはデータの見方から↓で解説していく。
Tweet media one
1
11
101
@nomu_chem
ノムオ
6 months
データサイエンスを仕事で活用し始めて約4年、最近はpythonの不安もほぼ無くなってきて、やり始めた頃とは全然違ったことを考えているな〜と感じる。 4年前は、pythonで機械学習を実装するコードだったり、化学構造ってどう取り扱うのがいいか?みたいな事ばかり考えてたけど、
1
6
101
@nomu_chem
ノムオ
5 months
私がデータサイエンス関連の発信をしている理由 ・PC1つで場所を選ばず仕事してる人に憧れている ・スキル(機械学習、説明能力)を見える化したい ・発信(言語化)することで私自身も学びたい ・承認欲求はないが、他者からの感謝が嬉しい ・データサイエンス人材の育成に興味がある
1
7
98
@nomu_chem
ノムオ
6 months
chatgptのGPT4oの話題持ちきりの1日ですが、マジで返答早いし正確だし凄い。。 だから、これからデータサイエンス(機械学習)の勉強を始めようと思ってる人はchatgptを活用して勉強してみてはと思う。 当たり前なんですが、chatgptも含めて、使ってる人にしか使い方がわからない。
1
5
98
@nomu_chem
ノムオ
7 months
受験やデータサイエンスの独学を経験したけど、未だによくわからないのが「昼寝」。 昼寝して脳がスッキリして、その後凄く勉強が捗る時もあれば、 昼寝しても、何だか脳がスッキリせずに、モヤがかった状態のままで、今日は無理だとなってしまう時もある。
2
1
99
@nomu_chem
ノムオ
3 months
私の機械学習技術ブログで最も読まれてるLightGBMに纏わる記事、今見たら、1700回も読まれてます!!ありがとうございます😭 広告とか入れるつもりないんで、外部メモリとして活用して欲しいです〜😎
@nomu_chem
ノムオ
8 months
kaggle等のコンペで頻出のLightGBMを使った機械学習(回帰)を実施する手順の解説記事を書きました。 前処理、モデル構築、Optunaを使ってハイパーパラメータを最適化する一連の流れを解説しています! 土曜日の「おつまみ」として良ければご活用ください!!
Tweet media one
Tweet media two
1
25
317
0
14
99
@nomu_chem
ノムオ
6 months
データサイエンスやるんならjupyter labやjupyter notebookでいいと思う。 特に初学者にはお勧めしたい。 データを確認しながら進めれるし、スクリーンショットで出力結果をPowerPointに貼り付けて報告資料にもできるし。 デーサイエンス関連のセミナーもjupyter
0
5
97
@nomu_chem
ノムオ
7 months
データサイエンスの独学を始めて約5年、最近少しだけ人生が変わってきたと感じている。 まず2000人を越える皆さんにフォローしてもらうことなんて想像もしていなかった。 いつもありがとうございます。 また5年前は、自分が誰かの役に立てるなんて考えたこともなかった。
1
1
94
@nomu_chem
ノムオ
4 months
研究開発でデータサイエンスを活用し始めて疑問に思ったこと ・研究でコンサルって本当に必要なの? ・1個ずつパラメータを動かして実験するやり方が本当に正しいの? ・実はわかりやすい説明のためにデータをとってない? ・現象を理解することが目的なの? ・過去データをちゃんと活用できてる?
1
6
96
@nomu_chem
ノムオ
8 months
データサイエンス(機械学習)がここまでバズった要因について考えてみる ・企業が大量のデータを保有している ・pythonで簡単に実装できる ・数学を理解しなくても最悪使える
0
8
92
@nomu_chem
ノムオ
7 months
機械学習(教師あり学習)をやっていない人でも、機械学習のイメージが掴めるように「図解」してみる。 今回は私が初学者の時、特に難しいと感じた機械学習の「学習」について。 図解してみると下記のような感じ。 ・機械学習では、Xとyの関係を表すFを構築。つまりy = F(X)のFを構築。
Tweet media one
@nomu_chem
ノムオ
7 months
機械学習(教師あり学習)の表データの見方を図解。 住宅の価格を「住宅の広さ、最寄駅からの距離、築年数」から予測する場合を考えると図のような感じ。 ・Xは表の左側、yは表の右側に記載するのが慣例 ・今回はX(説明変数は)3つ(X1、X2、X3) ・Xとyはセットで1つのデータ(1行で1つのデータ)
Tweet media one
0
0
15
0
5
92
@nomu_chem
ノムオ
7 months
機械学習スキルは横展開しやすいから、転職に有利なんだなと、ふと感じた。 化学メーカーで機械学習を活用して研究開発やってるけど、正直どこの化学メーカーでもいける気がしてきた。 理由は機械学習スキルを転職先でもそのまま活用できそうだから。
1
5
93
@nomu_chem
ノムオ
9 months
データサイエンスの勉強を始めるのは今からでも全然遅くないと思う。 また何歳からでもいい。 DXがバズワードになってから数年経ってるけど、現時点でもあんまり推進してないなぁと感じるし、DX人材も増えていくイメージが湧かない。 スキルを身につけるのは若いに越したことはない。
0
4
92