@tetsuro731
機械学習とか統計とかやってる人。企業のデータサイエンティスト。個人で分析系のお仕事やAIベンチャーのアドバイザーなども。物理学博士。身長と体重がベジータと同じ。Kaggle Competition Expert 🥈3🥉1 英語も勉強中。
@TeaTheKook
@RealMastaKilla
@XavierSote_EC
@H_2_Y
@anou_saori
@SangeetBangla
@WrestleMagazine
@Parlonzen1
@yuzunyan383838
@AlexHaganMMJ
@TurismoAlczares
@OSMANOS20595091
@EvanLeParisien
@PorthillySpirit
@tokonator10
@wuchonk
@paro322
@BitgetInsights
@Kousuke18959676
@YB92_11
データサイエンティストってなんだ?僕は現在とあるコーヒーチェーン企業でデータサイエンティストとして働いている。なんやかんやで社会に出てから約5年ほどが経った。ただ、正直なところ僕自身が最近までデータサイエンティストがどのような職業なのかよくわかっていなかった…
結構前にMLFlowをいろいろ触ってみていたんですが、最近全然触っていなかったので色々見てみました。 www.nogawanogawa.com 前に自分が触っていたときよりだいぶ使いやすくなってたので、今回は最近の自分の用途に合わせて改めてMLFlowを使ってみます。
はじめに二値分類の評価指標について「AUCとGini係数ってどんな関係だっけ?」と毎回忘れては調べているので、いい加減覚える意味で体系的にまとめてみる。この記事ではAUCとは何か?Gin…
この記事で伝えたいことA/BテストにおいてはCTRやCVRのように比率の差の検定 (proportion z-test) を行うことが多い。本記事ではこの検定を完全に理解するのを目的とする。ま…
この記事でやりたいことLightGBMを使って学習、実験した結果をMLFlowを使ってちゃんと管理したい。というわけでこの記事ではタイタニック生存予測のデータを使ってLightGBM+MLFlo…
LightGBMとearly_stoppingLightGBMは2022年現在、回帰問題において最も広く用いられている学習器の一つであり、機械学習を学ぶ上で避けては通れない手法と言えます。Lig…
Polars Data Crunch #2 での発表資料です。
はじめに正則条件下における最尤推定量の一致性と漸近正規性についてまとめます.シンプルな主張ですが証明は大変です.関連する定理などをまとめていたら長くなってしまったので,必要なところだけ読んでくださ…
はじめにA/Bテストをやるときに避けて通れないのがt検定をはじめとする統計的仮説検定(以下仮説検定) だ。QiitaだとRやPythonを使ってt検定を実践しているページはたくさんあったが、「…
関東Kaggler会の資料です。
Prepare for a machine-learning interview by researching the questions you may be asked. Review 10 questions with sample answers to help you form your responses.
はじめにKaggle初挑戦でH&Mコンペに参加したので、振り返ってみたいと思う。この記事の目的はコンペの記憶がなくならないうちに知見を残しておくKaggle初心者がどのようにKaggleに臨…
概要LightGBMTunerを使うとLightGBMで簡単にOptunaを使ったハイパラチューニングができる。...という記事を以前投稿した。https://qiita.com/tetsur…
# 概要 Polars-ja(https://github.com/polars-ja) は、日本の開発者やデータ分析者が集い、Polars の活用方法を共有・学習するためのコミュニティです。 2024年4月の立ち上げを記念して、初のLTイベントを開催します!Polarsの入門者や興味のある方、ぜひこの絶好の機会にご参加ください。 # 会場 オンライン開催 YouTube Liveでの配信を...
概要タイトルの通りなのだが、LightGBMをGPUで回すと結果の再現性が得られないことに気づいた。CPUの場合は乱数seedを42などに固定すれば、同じ条件で何回回しても毎回同じ結果が得られる。しかし、GPUの場合は乱数seedを固定しても回すたびに結果が変わってしまうのだ…
no description