INTERPRETABILITY
2025
Sparse Autoencoders Reveal Compositional Reasoning Circuits in Mythos
Mythos の内部表現を sparse autoencoder で展開し、合成的推論を担う回路を初めて系統的に同定した。
Hanako Sample, Taro Sample, et al.
人類の知性を拡張する AI を、責任を持って。
We are a research lab dedicated to building safe, interpretable, and beneficial AI systems. Our work is published openly and grounded in the science of safety.
4 つのチーム、ひとつの使命。
私たちは、安全で解釈可能で社会に資する AI のために、独立した 4 つの研究チームを並走させる。各チームは独自の論文発表とコードを公開する責任を持つ。
Mythos シリーズ。
フロンティアモデル Mythos、低レイテンシ推論エンジン Marlin、オープン重み Fable、マルチモーダル Echo の 4 モデル。すべてに Model Card と Safety Case Study を併載する。
Frontier reasoning model.
長文脈推論・科学計算・コード生成を統合した基盤モデル。Constitutional AI で訓練し、 Safety Case Study を公開。
Benchmarks · Mythos vs Peer Avg.
Safety is a science.
私たちは Safety を、後付けのコンプラ要件としてでなく、最初の設計原理として扱う。 すべての安全性主張は、再現可能な評価で裏付ける。すべての Safety Case Study を公開する。
Safety Documents
安全性は科学である
安全性を、ベストエフォートのチェックリストでなく、実証研究の対象として扱う。すべての安全性主張を、再現可能な評価で裏付ける。
原則として公開する
Model Card / Evaluation Report / Safety Case Study を、商用モデルでも公開する。コミュニティの検証可能性を最大化する。
安全性で頂点を目指す
能力で競うのではなく、安全性で競う業界のスタンダードを作る。私たちが先に安全性を引き上げる。
責任あるスケーリング
モデル能力の各段階で、必要な安全性プロトコルを事前に定義する Responsible Scaling Policy (RSP) を採用。
最近の論文。
INTERPRETABILITY
2025
Mythos の内部表現を sparse autoencoder で展開し、合成的推論を担う回路を初めて系統的に同定した。
Hanako Sample, Taro Sample, et al.
ALIGNMENT
2025
AI 自身の自己批評ループのみで、人間ラベルなしに Constitutional AI 相当の整合性を達成する手法を提示。
Taro Sample, Saburo Sample, et al.
FRONTIER EVALUATION
2025
生物・サイバー・自律性の 3 領域における危険能力評価プロトコルを公開。第三者再現可能な形で詳述。
Saburo Sample, Hanako Sample, et al.
研究者による、研究者のための研究機関。
80 名の Researcher / Engineer を率いる経営チーム。前職はトップ大学・大手 AI 研究機関・国際機関。
Co-founder, CEO
Taro Sample
元 トップ大学 AI Lab / 元 大手 AI 研究機関 Alignment Team
トップ大学で PhD (Computer Science, AI Alignment 専攻)。NeurIPS / ICML に 12 本の論文掲載。大手 AI 研究機関で Alignment 研究を 4 年間リードしたのち、2023 年に当社を共同創業。
“安全性は、後付けのチェックリストでなく、最初の設計原理である。私たちはそう信じている。”
Co-founder, Chief Scientist
Hanako Sample
元 大手 AI 研究機関 / NeurIPS 2022 Best Paper Award
大手 AI 研究機関で Mechanistic Interpretability チームを 5 年間リード。NeurIPS 2022 Best Paper Award 受賞。海外トップ大学で PhD (Theoretical Neuroscience)。
“ニューラルネットの内部を、私たちが顕微鏡で生物を観るように、解像度をもって観る。それが解釈可能性の科学である。”
Head of Policy & Governance
Jiro Sample
元 トップ公共政策大学院 / 元 国際機関 AI Unit
トップ公共政策大学院で Public Policy 修士。国際機関 AI Unit で 6 年間の政策分析経験。AI 規制と国際的整合性に注力。
Papers
投資家とパートナー。
Series C ラウンドは Sample Ventures / Sample Capital がリード。Sample Cloud / Sample Corp が戦略投資家として参加。詳細は About ページ で開示しています。
Lead & Strategic Investors
Enterprise Partners
重みも、評価ツールも、デフォルトで公開。
Fable 7B / 13B / 70B の重みは Apache 2.0 で公開。Frontier Evaluation チームの安全性評価スイートも GitHub 上で完全公開し、第三者再現性を担保する。
世界と AI が出会う場所を、設計してほしい。
ここでは、Engineer は多くの Research をし、Researcher は多くの Engineering をする。 境界は薄く、ミッションは一つ。
メディアで言及されたこと。
"a quiet but uncompromising bet on safety."
TechCrunch
"published the first reproducible Constitutional AI replication."
Nature
"a research-first lab with serious enterprise traction."
Bloomberg
"the interpretability work is genuinely novel."
Wired
"transparency by default."
MIT Tech Review
あなたの立場に合わせた、4 つの入り口。