Koki Wataoka

Koki Wataoka Responsible AI Team, SB Intuitions / Softbank

About

I lead the Responsible AI Team at SB Intuitions, working on AI Safety, especially red-teaming and guardrails for LLMs and VLMs. Previously worked on fairness and privacy‑preserving computation. My recent work studies LLM‑as‑a‑Judge biases (verbosity / self‑preference), jailbreak attacks, and LLM fingerprinting.

Career

2023 – Present
Responsible AI Team
SB Intuitions
2021 – 2023
Trustworthy AI Team
LINE Corporation
2019 – 2021
MS Student
Kobe University
2015 – 2019
Undergraduate Student
Osaka City University

Publications

International (peer‑reviewed)

Shojiro Yamabe, Futa Kai Waseda, Tsubasa Takahashi, Koki Wataoka — ACL 2025 Main
Koki Wataoka, Tsubasa Takahashi, Ryokan Ri — NeurIPS 2024 Safe Generative AI Workshop
Thien Q Tran, Koki Wataoka, Tsubasa Takahashi — ICLR 2024 Workshop on Secure & Trustworthy LLMs
Keita Saito, Akifumi Wachi, Koki Wataoka, Youhei Akimoto — NeurIPS 2023 Workshop

Domestic (Japan)

大萩雅也, 綿岡晃輝, 高山隼矢, 吉川克正 — 言語処理学会第31回年次大会 (NLP 2025)
黒澤友哉, 高山隼矢, 綿岡晃輝, 小林滉河, 浅原正幸, 西内沙恵 — 言語処理学会第31回年次大会 (NLP 2025)
綿岡晃輝, 髙橋翼, 李凌寒 — コンピュータセキュリティシンポジウム (CSS) 2024 論文集, pp.214‑221
綿岡晃輝, Thien Q. Tran, 前田若菜, 髙橋翼 — 言語処理学会第30回年次大会 (NLP 2024)
Thien Q. Tran, 綿岡晃輝, 髙橋翼 — 言語処理学会第30回年次大会 (NLP 2024)
長谷川聡, 綿岡晃輝, 骻橋翼, 竹之内隆夫 — CSS 2023 論文集, pp.1412‑1419
綿岡晃輝, 長谷川聡, 高橋翼, 竹之内隆夫 — CSS 2023 論文集, pp.1405‑1411
綿岡晃輝, 野崎雄斗, 馬越雅人, 高橋翼 — CSS 2022 論文集, pp.1322‑1328 [奨励賞]
公平性が引き起こす敵対的攻撃に対する脆弱性
綿岡晃輝, 松原崇, 上原邦昭 — 電子情報通信学会 技術研究報告 119(476), pp.101‑105, 2020
公平性により生じる敵対的攻撃に対する脆弱性
綿岡晃輝, 松原崇, 上原邦昭 — 人工知能学会 全国大会 (2020)

Patents

綿岡晃輝 — 日本国特許庁 (Japan Patent Office)

Contact & Links

Email: wataoka.koki@gmail.com

Google Scholar · GitHub · X