🇺🇸 English🇯🇵 日本語
iconiconicon

Kaito Baba (kAIto47802)

:1
First-year master's student at the University of Tokyo Graduate School of Information Science and Technology
k.ai.to47802 [at] gmail.com
baba-kaito662 [at] g.ecc.u-tokyo.ac.jp
GitHubScholarScholar

Biography

東京大学大学院情報理工学系研究科修士課程1年。大規模言語モデル (LLM)、深層学習、最適化、学習理論、アルゴリズムなどの研究に興味があります。

下線: Featured publications

国際会議論文 (査読あり)International Conference Proceedings

LAVA Challenge 2025: Advancing Japanese Document Understanding with a Challenging PDF-VQA Benchmark
Daichi Sato, Duc Minh Vo, Khan Md. Anwarus Salam, Hidenori Shoji, Yuma Matsuoka, Takara Taniguchi, Kaito Baba, and Hideki Nakayama
The 33rd ACM International Conference on Multimedia, 2025
Poster
Kaito Baba, Wataru Nakata, Yuki Saito, and Hiroshi Saruwatari
IEEE Spoken Language Technology Workshop (SLT), 2024
GitHubarXivPosterPoster

国際会議ワークショップ論文 (査読あり)Workshop Papers at International Conferences

Kaito Baba, Chaoran Liu, Shuhei Kurita, and Akiyoshi Sannai
ICML Workshop on AI for Math, 2025
GitHubarXivPosterPoster
JRadiEvo: A Japanese Radiology Report Generation Model Enhanced by Evolutionary Optimization of Model Merging
Kaito Baba, Ryota Yagi, Junichiro Takahashi, Risa Kishikawa, and Satoshi Kodera
NeurIPS Workshop on AIM-FM: Advancements In Medical Foundation Models: Explainability, Robustness, Security, and Beyond, 2024
arXivPoster
Application of Contrastive Learning on ECG Data: Evaluating Performance in Japanese and Classification with Around 100 Labels
Junichiro Takahashi, JingChuan Guan, Masataka Sato, Kaito Baba, Kazuto Haruguchi, Daichi Nagashima, Satoshi Kodera, and Norihiko Takeda
NeurIPS Workshop on AIM-FM: Advancements In Medical Foundation Models: Explainability, Robustness, Security, and Beyond, 2024
arXiv

プレプリントPreprints

Multi-Modal Multi-Agent Reinforcement Learning for Radiology Report Generation: Radiologist-Like Workflow with Clinically Verifiable Rewards
Kaito Baba and Satoshi Kodera
arXiv preprint arXiv:2603.16876, 2026
arXiv
Kaito Baba, Yoshihiko Ozaki, and Shuhei Watanabe
arXiv preprint arXiv:2601.20800, 2026
GitHubarXiv

記事Articles

[Optuna v4.5] Gaussian Process-Based Sampler (GPSampler) Can Now Perform Constrained Multi-Objective Optimization
Kaito Baba
Medium, 2025
Link
[Optuna v4.5] ガウス過程を利用した Sampler の制約付き多目的最適化対応
Kaito Baba
Preferred Networks Tech Blog, 2025
Link
[Optuna v4.2] Gaussian Process-Based Sampler Can Now Handle Inequality Constraints
Kaito Baba
Medium, 2025
Link
[Optuna v4.2] ガウス過程を利用した Sampler の不等式制約対応
Kaito Baba
Preferred Networks Tech Blog, 2025
Link

国内会議論文Domestic Conference Proceedings

LAVA Challenge: Benchmarking Japanese-English Document Understanding with Large Vision-Language Models
Daichi Sato, Duc Minh Vo, Khan Md. Anwarus Salam, Hidenori Shoji, Yuma Matsuoka, Takara Taniguchi, Kaito Baba, and Hideki Nakayama
画像の認識・理解シンポジウム (MIRU), 2025
UTMOSv2: 自然性MOS予測におけるスペクトログラム特徴量とSSL特徴量の統合的利用
馬場 凱渡,中田 亘,齋藤 佑樹,猿渡 洋
日本音響学会第152回 (2024年秋季) 研究発表会, 2024
GitHub

Organizing Committee Member
ACM MM 2025 Workshop and Grand Challenge on Large Vision Language Model Learning and Applications Grand Challenge

–2024年8月
Kaggle コンペティション 銅メダル🥉×4
–2024年8月
世界最大規模の機械学習コンペティションであるKaggleでこれまでに4回銅メダルを獲得しました。
2024年6月
VoiceMos Challenge 2024 Track1 16項目中7項目で1位🥇,残り9項目で2位🥈
2024年6月
合成音声の自然性MOSを予測する機械学習モデルを作成する国際コンペティションで上記の順位を獲得しました。
2024年3月
アイフル主催ハッカソン (aihack2024) 優勝🥇
2024年3月
顧客が貸し倒れするか否かを予測する機械学習モデルを作成しました。
2023年10月
ライフカード主催ハッカソン 3位🥉
2023年10月
与信スコアを予測する機械学習モデルを作成しました。
2023年9月
CodinGame オセロAIコンペティション 世界3位🥉
2023年9月
深層強化学習と探索アルゴリズムを組み合わせてオセロAIを開発しました。
2023年3月
ソフトバンク主催ハッカソン 本選4位 特別賞🏅
2023年3月
物体検知モデルを搭載したWebアプリケーションを開発しました。

2024年7月
現在
株式会社Preferred Networks
パートタイムエンジニア
2024年7月現在
AutoMLチームにてハイパーパラメータ最適化ライブラリのOptunaの開発を行っております。
2024年5月
現在
東京大学医学部附属病院
学術専門職員(特定短時間勤務有期雇用教職員)
2024年5月現在
医療AIの研究開発を医師と共に行っております。
2023年12月
2024年5月
株式会社 SIGNATE
技術アドバイザー・教材作成担当(業務委託)
2023年12月2024年5月
LLM の技術アドバイザーとして,主にRAGに関する資料作成や技術アドバイスを行っておりました。
データ分析・LLMの活用方法・アルゴリズム・最適化などに関する教材作成を行っておりました。
2023年11月
2024年4月
株式会社 kuzen
フルスタックエンジニア(インターンシップ)
2023年11月2024年4月
フロントエンドやバックエンドの実装,LangChainを用いたRAGシステムの開発などを行っておりました。
2023年10月
2023年12月
株式会社リクルート
データサイエンティスト(インターンシップ)
2023年10月2023年12月
データ推進室の検索グループにて,社内ドキュメントの検索体験の向上を目的として,RAGのシステム開発を行っておりました。
2023年7月
2025年4月
東京大学エッジキャピタルパートナーズ UTEC
リサーチアシスタント
2023年7月2025年4月
投資家のためのデータ収集・分析・予測モデルの作成などを行っておりました。
社内ツールのシステム開発を行っておりました。
2023年4月
2023年9月
株式会社 LearnWiz
フロントエンドエンジニア(業務委託)
2023年4月2023年9月
Web アプリケーションのフロントエンド開発とUI/UXデザインの提案を行っておりました。
2023年1月
2023年9月
GHELIA 株式会社
AIリサーチャー(インターンシップ)
2023年1月2023年9月
画像認識に関する深層学習の研究開発を行っておりました。

2025年4月
2027年3月 (予定)
東京大学大学院情報理工学系研究科
修士
2025年4月2027年3月 (予定)
指導教員:中山英樹教授
2022年9月
2025年3月
東京大学工学部計数工学科
学士
2022年9月2025年3月
指導教員:鈴木大慈教授
2021年4月
2022年8月
東京大学理科一類
学士
2021年4月2022年8月

2026年2月
2026年4月
ソルボンヌ大学 (Sorbonne University)
Internship
Laboratoire d’informatique de Sorbonne Université (LIP6)
2026年2月2026年4月
Worked with Prof. Evripidis Bampis.
Conducted research on learning-augmented algorithms.
2025年2月
2025年3月
国立清華大学 (National Tsing Hua University)
Short-term Exchange Program
工業工程與工程管理學系 (Department of Industrial Engineering and Engineering Management)
2025年2月2025年3月
Worked with Prof. Wing-Kai Hon
効率的なアルゴリズムに関する研究

扱っている領域:
深層学習,強化学習,アルゴリズム,フロントエンド,バックエンド,iOS アプリ開発 など
使用言語・フレームワーク:
Advanced:
Rust, Python, PyTorch, TensorFlow, TypeScript, JavaScript, React, Next.js, HTML/CSS, C, C++, bash, Swift, Go, Google Apps Script, R
Intermediate:
Haskell, OCaml, Scheme, Assembly (RISC-V), SQL, Fortran, Verilog, C# (Unity), Julia, Java, Kotlin
ツール:
Git/GitHub, Docker, AWS, GCP, Linux, GitHub Actions, GraphQL, Terraform, Arduino, Raspberry Pi など