Vol. I · No. 1 · 一份解剖笔记
CLASSIFICATION: PSEUDOSCIENCE · 2026

SBTI 解剖 A Dissection of an Internet Personality Test —— 把一份"宇宙稀有人格测试"摊在解剖台上,看看它到底是怎么把你分类的。

原测试:B站 @蛆肉儿串儿 解剖:你自己 方法:每一次点击都会暴露算法

摘要。原版 SBTI 测试在界面上只告诉你题目,按钮背后的分数、维度映射、类型模板、匹配算法全部藏在一个 1700 行的 HTML 文件里。本页保留了原测试全部的 30 道常规题 + 2 道隐藏题,但把一切都摊开:每个选项直接标注它给哪个维度加多少分;右侧实时显示 15 维得分、当前匹配排名、触发的隐藏规则;每当你触发某种算法上的"结构性缺陷"时,系统会在批注栏里告诉你这到底是怎么回事。读完之后你会发现——这不是一份量表,这是一台披着心理学外衣的模板匹配器

I.

题目与透明化选项

30 items + 2 hidden

每个选项右侧的小字是它对应的维度加分。维度名称上方的灰字是它所属的"模型"。像读一张带答案的试卷一样,做完它。

II.

隐藏问题:酒鬼之门

hidden branch

这两题藏在原测试的答题流程中。第一题是烟雾弹(完全不计分),第二题的第二个选项会直接把你的结果覆盖为"DRUNK 酒鬼",跳过所有算法。

III. 为什么它不科学

  1. 维度切分精度极低。每个维度只有 2 道题,原始分只有 2/3/4/5/6 五种取值,被强行映射成 L/M/H 三档(≤3→L, =4→M, ≥5→H)。这意味着你整份答卷在"类型空间"里只有 315 ≈ 1400 万个可能向量——但实际上绝大部分答题模式会落在同一个小区域里。一题答案的改变就能把你从一个人格弹到另一个人格。
  2. 匹配度的数学是虚高的。算法用曼哈顿距离算你和每个模板的差,然后用 1 − distance/30 归一化。分母 30 是"全 L 到全 H"的极端距离——现实中几乎不可能出现。这让"匹配度 92%"变成了默认显示值,看起来贴合度很高,实际上只要你不是外星人都能拿 80 分
  3. 类型模板高度重叠。CTRL、BOSS、GOGO、ATM-er、WOC!、THIN-K 这几个类型前 6 位几乎都是 HHHHHL + HMH。算法排序的"第一名"和"第二名"常常只差 1–2 位,几乎等同于抛硬币。你以为结果在说"你就是 CTRL",算法其实在说"你和 CTRL 比和 BOSS 近那么一丁点"。
  4. 题目本身带强诱导。q1 是一段 600 字的自述小作文,把 S1(自尊自信)的答题方向直接焊死;q22 干脆写着"此题没有题目,请盲选"——这已经不是测量,是在强制分配随机性。q14 和 q20 把选项包裹在大段抽象描述里,属于答非所问式校准:你在判断故事好不好笑,它在记录你的维度得分。
  5. 硬编码的隐藏规则。"酒鬼"人格完全脱离量表——它只是一道是非题。"HHHH 傻乐者"是算法的错误兜底——它存在的唯一原因是作者没把类型库铺满。这两个规则意味着:并不是所有人都被同一套标准衡量,有些人直接被规则跳过了。
  6. 没有任何效度 / 信度检验。没有大样本、没有做因子分析、没有 α 系数、没有重测一致性。维度名字(S1 自尊自信、E1 依恋安全感……)看起来借自心理学,但背后没有任何量表学依据——名词是真的,方法是假的。严谨的人格问卷(如 NEO-PI-R、HEXACO)每个维度动辄 10–20 题,加严格统计学校验,SBTI 每个维度 2 题就开始下诊断。
  7. 作者自己承认了。测试页底部的"作者的话"里写着:"我没法很好的平衡娱乐和专业性,对于一些人格的阐释较为模糊或完全不准"、"随便搞了一个先这样玩玩"、"好玩为主,请不要用于盈利"。这份测试被当成娱乐产品发布,在传播时却被当成"人格诊断"——这不是作者的错,是传播路径的错。

结论:SBTI 是一份好玩的、文案很好笑的、技术上完成度不低的恶搞作品。把它当段子看,它是一等一的段子;把它当测试看,它连 MBTI 的脚后跟都够不到——而 MBTI 本身在学术心理学里也不被当量表用。别拿自己的 16 个字母去对号入座,更别拿 4 个英文字母去对号入座。