Kaito Baba (kAIto47802)

馬場凱渡:東京大学大学院情報理工学系研究科修士2年

Second-year master's student at the University of Tokyo Graduate School of Information Science and Technology

k.ai.to47802 [at] gmail.com

baba-kaito662 [at] g.ecc.u-tokyo.ac.jp

Biography

東京大学大学院情報理工学系研究科修士課程2年。大規模言語モデル (LLM)、深層学習、最適化、学習理論、アルゴリズムなどの研究に興味があります。

発表論文

下線: Featured publications

国際会議論文 (査読あり)International Conference Proceedings

Conditional PED-ANOVA: Hyperparameter Importance in Hierarchical & Dynamic Search Spaces

Kaito Baba, Yoshihiko Ozaki, and Shuhei Watanabe

Proceedings of the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2026

LAVA Challenge 2025: Advancing Japanese Document Understanding with a Challenging PDF-VQA Benchmark

Daichi Sato, Duc Minh Vo, Khan Md. Anwarus Salam, Hidenori Shoji, Yuma Matsuoka, Takara Taniguchi, Kaito Baba, and Hideki Nakayama

Proceedings of the 33rd ACM International Conference on Multimedia (ACM MM), 2025

The T05 System for the VoiceMOS Challenge 2024: Transfer Learning from Deep Image Classifier to Naturalness MOS Prediction of High-Quality Synthetic Speech

Kaito Baba, Wataru Nakata, Yuki Saito, and Hiroshi Saruwatari

IEEE Spoken Language Technology Workshop (SLT), 2024

国際会議ワークショップ論文 (査読あり)Workshop Papers at International Conferences

Prover Agent: An Agent-Based Framework for Formal Mathematical Proofs

Kaito Baba, Chaoran Liu, Shuhei Kurita, and Akiyoshi Sannai

ICML Workshop on AI for Math, 2025

JRadiEvo: A Japanese Radiology Report Generation Model Enhanced by Evolutionary Optimization of Model Merging

Kaito Baba, Ryota Yagi, Junichiro Takahashi, Risa Kishikawa, and Satoshi Kodera

NeurIPS Workshop on AIM-FM: Advancements In Medical Foundation Models: Explainability, Robustness, Security, and Beyond, 2024

Application of Contrastive Learning on ECG Data: Evaluating Performance in Japanese and Classification with Around 100 Labels

Junichiro Takahashi, JingChuan Guan, Masataka Sato, Kaito Baba, Kazuto Haruguchi, Daichi Nagashima, Satoshi Kodera, and Norihiko Takeda

NeurIPS Workshop on AIM-FM: Advancements In Medical Foundation Models: Explainability, Robustness, Security, and Beyond, 2024

ジャーナル論文 (査読あり)Journals

JRadiEvo: A Japanese Radiology Report Generation Model Enhanced by Evolutionary Optimization of Model Merging

Kaito Baba, Satoshi Kodera, Ryota Yagi, Junichiro Takahashi, Risa Kishikawa, Junichi Ishida, and Norihiko Takeda

Artificial Intelligence in Medicine, 2026

プレプリントPreprints

Learning-Augmented Approximation for Unrelated-Machines Makespan Scheduling

Kaito Baba, Evripidis Bampis, and Giorgos Mitropoulos

arXiv preprint arXiv:2606.13133, 2026

Multi-Modal Multi-Agent Reinforcement Learning for Radiology Report Generation

Kaito Baba, Risa Kishikawa, and Satoshi Kodera

arXiv preprint arXiv:2603.16876, 2026

記事Articles

[Optuna v4.5] Gaussian Process-Based Sampler (GPSampler) Can Now Perform Constrained Multi-Objective Optimization

Kaito Baba

Medium, 2025

[Optuna v4.5] ガウス過程を利用した Sampler の制約付き多目的最適化対応

Kaito Baba

Preferred Networks Tech Blog, 2025

[Optuna v4.2] Gaussian Process-Based Sampler Can Now Handle Inequality Constraints

Kaito Baba

Medium, 2025

[Optuna v4.2] ガウス過程を利用した Sampler の不等式制約対応

Kaito Baba

Preferred Networks Tech Blog, 2025

国内会議論文Domestic Conference Proceedings

LAVA Challenge: Benchmarking Japanese-English Document Understanding with Large Vision-Language Models

Daichi Sato, Duc Minh Vo, Khan Md. Anwarus Salam, Hidenori Shoji, Yuma Matsuoka, Takara Taniguchi, Kaito Baba, and Hideki Nakayama

画像の認識・理解シンポジウム (MIRU), 2025

UTMOSv2: 自然性MOS予測におけるスペクトログラム特徴量とSSL特徴量の統合的利用

馬場凱渡，中田亘，齋藤佑樹，猿渡洋

日本音響学会第152回 (2024年秋季) 研究発表会, 2024

受賞歴

–2024年8月

Kaggle コンペティション銅メダル🥉×4

–2024年8月

世界最大規模の機械学習コンペティションであるKaggleでこれまでに4回銅メダルを獲得しました。

2024年6月

VoiceMos Challenge 2024 Track1 16項目中7項目で1位🥇，残り9項目で2位🥈

2024年6月

合成音声の自然性MOSを予測する機械学習モデルを作成する国際コンペティションで上記の順位を獲得しました。

2024年3月

アイフル主催ハッカソン (aihack2024) 優勝🥇

2024年3月

顧客が貸し倒れするか否かを予測する機械学習モデルを作成しました。

2023年10月

ライフカード主催ハッカソン 3位🥉

2023年10月

与信スコアを予測する機械学習モデルを作成しました。

2023年9月

CodinGame オセロAIコンペティション世界3位🥉

2023年9月

深層強化学習と探索アルゴリズムを組み合わせてオセロAIを開発しました。

2023年3月

ソフトバンク主催ハッカソン本選4位特別賞🏅

2023年3月

物体検知モデルを搭載したWebアプリケーションを開発しました。

職歴

2024年7月
–現在

株式会社Preferred Networks

パートタイムエンジニア

2024年7月–現在

AutoMLチームにてハイパーパラメータ最適化ライブラリのOptunaの開発を行っております。

2024年5月
–現在

東京大学医学部附属病院

学術専門職員（特定短時間勤務有期雇用教職員）

2024年5月–現在

医療AIの研究開発を医師と共に行っております。

2023年12月
–2024年5月

株式会社 SIGNATE

技術アドバイザー・教材作成担当（業務委託）

2023年12月–2024年5月

LLM の技術アドバイザーとして，主にRAGに関する資料作成や技術アドバイスを行っておりました。

データ分析・LLMの活用方法・アルゴリズム・最適化などに関する教材作成を行っておりました。

2023年11月
–2024年4月

株式会社 kuzen

フルスタックエンジニア（インターンシップ）

2023年11月–2024年4月

フロントエンドやバックエンドの実装，LangChainを用いたRAGシステムの開発などを行っておりました。

2023年10月
–2023年12月

株式会社リクルート

データサイエンティスト（インターンシップ）

2023年10月–2023年12月

データ推進室の検索グループにて，社内ドキュメントの検索体験の向上を目的として，RAGのシステム開発を行っておりました。

2023年7月
–2025年4月

東京大学エッジキャピタルパートナーズ UTEC

リサーチアシスタント

2023年7月–2025年4月

投資家のためのデータ収集・分析・予測モデルの作成などを行っておりました。

社内ツールのシステム開発を行っておりました。

2023年4月
–2023年9月

株式会社 LearnWiz

フロントエンドエンジニア（業務委託）

2023年4月–2023年9月

Web アプリケーションのフロントエンド開発とUI/UXデザインの提案を行っておりました。

2023年1月
–2023年9月

GHELIA 株式会社

AIリサーチャー（インターンシップ）

2023年1月–2023年9月

画像認識に関する深層学習の研究開発を行っておりました。

学歴

2025年4月
–2027年3月 (予定)

東京大学大学院情報理工学系研究科

修士

2025年4月–2027年3月 (予定)

指導教員：中山英樹教授

2022年9月
–2025年3月

東京大学工学部計数工学科

学士

2022年9月–2025年3月

指導教員：鈴木大慈教授

2021年4月
–2022年8月

東京大学理科一類

学士

2021年4月–2022年8月

学術サービス

Organizing Committee Member

ACM MM 2025 Workshop and Grand Challenge on Large Vision Language Model Learning and Applications Grand Challenge

その他の経験

2026年2月
–2026年4月

ソルボンヌ大学 (Sorbonne University)

Internship

Laboratoire d’informatique de Sorbonne Université (LIP6)

2026年2月–2026年4月

Worked with Prof. Evripidis Bampis.

Conducted research on learning-augmented algorithms.

2025年2月
–2025年3月

国立清華大学 (National Tsing Hua University)

Short-term Exchange Program

工業工程與工程管理學系 (Department of Industrial Engineering and Engineering Management)

2025年2月–2025年3月

Worked with Prof. Wing-Kai Hon

効率的なアルゴリズムに関する研究

技術スキル

扱っている領域：

深層学習，強化学習，アルゴリズム，フロントエンド，バックエンド，iOS アプリ開発など

使用言語・フレームワーク：

Advanced:

Rust, Python, PyTorch, TensorFlow, TypeScript, JavaScript, React, Next.js, HTML/CSS, C, C++, bash, Swift, Go, Google Apps Script, R

Intermediate:

Haskell, OCaml, Scheme, Assembly (RISC-V), SQL, Fortran, Verilog, C# (Unity), Julia, Java, Kotlin

ツール：

Git/GitHub, Docker, AWS, GCP, Linux, GitHub Actions, GraphQL, Terraform, Arduino, Raspberry Pi など