SBTI 解剖 · 一份不科学的人格测试，以及它为什么不科学

SBTI 解剖 A Dissection of an Internet Personality Test —— 把一份"宇宙稀有人格测试"摊在解剖台上，看看它到底是怎么把你分类的。

原测试：B站 @蛆肉儿串儿 解剖：你自己 方法：每一次点击都会暴露算法

摘要。原版 SBTI 测试在界面上只告诉你题目，按钮背后的分数、维度映射、类型模板、匹配算法全部藏在一个 1700 行的 HTML 文件里。本页保留了原测试全部的 30 道常规题 + 2 道隐藏题，但把一切都摊开：每个选项直接标注它给哪个维度加多少分；右侧实时显示 15 维得分、当前匹配排名、触发的隐藏规则；每当你触发某种算法上的"结构性缺陷"时，系统会在批注栏里告诉你这到底是怎么回事。读完之后你会发现——这不是一份量表，这是一台披着心理学外衣的模板匹配器。

题目与透明化选项

30 items + 2 hidden

每个选项右侧的小字是它对应的维度加分。维度名称上方的灰字是它所属的"模型"。像读一张带答案的试卷一样，做完它。

II.

隐藏问题：酒鬼之门

hidden branch

这两题藏在原测试的答题流程中。第一题是烟雾弹（完全不计分），第二题的第二个选项会直接把你的结果覆盖为"DRUNK 酒鬼"，跳过所有算法。

Progress

0 / 30

15 Dimensions LIVE

Type Match · Top 5 LIVE

⚠ Fallback triggered 当前最佳匹配度 —%，< 60%。原测试此时会强制跳过所有类型，把你硬塞给 HHHH 傻乐者。换句话说：算法放弃了，它只会说"你脑回路太奇怪"。这不是一个人格，这是一个错误码。

☠ Hidden override 你在酒鬼之门选择了第二项。原测试会立刻丢弃上面所有 15 维的计算结果，把你硬编码为 DRUNK 酒鬼，并把匹配度伪造为 100%。这是作者专门给某位爱喝酒的朋友埋的劝酒彩蛋——和你无关。

⚠ 虚高警告注意观察：匹配度几乎永远 ≥ 70%。这是因为分母是"全 L 到全 H"的极端距离 30，而实际分布早就被维度模板的同质性压在高区间——80%+ 是默认体感，不是贴合度。

⚠ 模板高度重叠第一名和第二名的距离差只有 —。多个类型共用 HHH / HMH 前缀，一个答案的变动就能让你从 CTRL 跳到 BOSS 再跳到 GOGO。"第一人格"的权威感是排序的假象。

III. 为什么它不科学

维度切分精度极低。每个维度只有 2 道题，原始分只有 2/3/4/5/6 五种取值，被强行映射成 L/M/H 三档（≤3→L, =4→M, ≥5→H）。这意味着你整份答卷在"类型空间"里只有 3¹⁵ ≈ 1400 万个可能向量——但实际上绝大部分答题模式会落在同一个小区域里。一题答案的改变就能把你从一个人格弹到另一个人格。
匹配度的数学是虚高的。算法用曼哈顿距离算你和每个模板的差，然后用 1 − distance/30 归一化。分母 30 是"全 L 到全 H"的极端距离——现实中几乎不可能出现。这让"匹配度 92%"变成了默认显示值，看起来贴合度很高，实际上只要你不是外星人都能拿 80 分。
类型模板高度重叠。CTRL、BOSS、GOGO、ATM-er、WOC!、THIN-K 这几个类型前 6 位几乎都是 HHH 或 HHL + HMH。算法排序的"第一名"和"第二名"常常只差 1–2 位，几乎等同于抛硬币。你以为结果在说"你就是 CTRL"，算法其实在说"你和 CTRL 比和 BOSS 近那么一丁点"。
题目本身带强诱导。q1 是一段 600 字的自述小作文，把 S1（自尊自信）的答题方向直接焊死；q22 干脆写着"此题没有题目，请盲选"——这已经不是测量，是在强制分配随机性。q14 和 q20 把选项包裹在大段抽象描述里，属于答非所问式校准：你在判断故事好不好笑，它在记录你的维度得分。
硬编码的隐藏规则。"酒鬼"人格完全脱离量表——它只是一道是非题。"HHHH 傻乐者"是算法的错误兜底——它存在的唯一原因是作者没把类型库铺满。这两个规则意味着：并不是所有人都被同一套标准衡量，有些人直接被规则跳过了。
没有任何效度 / 信度检验。没有大样本、没有做因子分析、没有 α 系数、没有重测一致性。维度名字（S1 自尊自信、E1 依恋安全感……）看起来借自心理学，但背后没有任何量表学依据——名词是真的，方法是假的。严谨的人格问卷（如 NEO-PI-R、HEXACO）每个维度动辄 10–20 题，加严格统计学校验，SBTI 每个维度 2 题就开始下诊断。
作者自己承认了。测试页底部的"作者的话"里写着："我没法很好的平衡娱乐和专业性，对于一些人格的阐释较为模糊或完全不准"、"随便搞了一个先这样玩玩"、"好玩为主，请不要用于盈利"。这份测试被当成娱乐产品发布，在传播时却被当成"人格诊断"——这不是作者的错，是传播路径的错。

结论：SBTI 是一份好玩的、文案很好笑的、技术上完成度不低的恶搞作品。把它当段子看，它是一等一的段子；把它当测试看，它连 MBTI 的脚后跟都够不到——而 MBTI 本身在学术心理学里也不被当量表用。别拿自己的 16 个字母去对号入座，更别拿 4 个英文字母去对号入座。