方法论 · 2026Q2
评分是如何计算的
本站对当前城市 146 家养老机构给出一个 0-100 的综合分数,仅作为 信息聚合工具,而非权威推荐。本页说明我们使用的算法结构、各维度含义与局限。
三条立场
- 不代理、不推荐:本榜单不接受任何机构的付费推广或公关干预。
- 公开数据、公开算法:评分所用数据全部来自政府公示、地图 POI 与公开点评,算法细节公开见下文。
- 评分不能代替实地考察:入住决策请务必结合实地走访、合同审阅与家属面谈。
算法:档位骨架 + 档内 TOPSIS
本站采用两层结构计算综合分:
① 档位骨架(官方星级决定分数区间)
民政局的星级评定是具有含金量的第三方实地评估。我们直接把星级映射为分数区间,不通过加权覆盖官方评定:
档间 gap=2:三星组最高分(64)< 四星组最低分(66)。愿景:"档内再强也强不过下一档垫底的"。
② 档内 TOPSIS(熵权法确定档内相对位置)
同档机构内部,用 TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)比较非星级维度的综合表现:
- 熵权法:根据指标在档内的分布自动定权——方差大(能区分机构)的指标权重高,方差小(大家都差不多)的指标权重低。避免"拍脑袋权重"。
- TOPSIS 贴近度:每家机构计算到档内"理想最优解"与"理想最差解"的距离,得贴近度 C ∈ [0, 1]。
- 线性映射:C 映射到档位区间。如某三星机构 C=0.8 → 分数 = 50 + 0.8 × 14 = 61.2。
进入 TOPSIS 的六个维度
各维度在档内的权重由熵权法自动分配,不同档位的权重可能不同(如五星档价格差异小,价格维度权重自然降低)。
档位基础
官方星级对应的分数段(5+=[92,100] / 5=[80,90] / ... / 1=[20,34])
周边配套
1公里内 9 类 POI(医院/药店/公园权重×1.5)
服务能力
失智/失能/长护/医养/康复/临终 6 项能力加权
资质水平
长护险定点、医养结合、公办属性等硬指标
性价比
档内价格相对位置(越低越好)
规模合理
床位数 150-300 最优,过大过小略降
未评星机构怎么办?独立赛道
当前城市 146 家机构中,28 家尚未获得民政局的官方星级评定。 未评星不代表机构差,可能是新建、未参评或信息未同步。但强行把它们塞进某个档位会误导家属。
我们采用独立赛道策略:
- 未评星机构单独跑一次 TOPSIS,彼此比较(而不是与已评星机构混排)
- 分数映射到独立区间 [45, 75],UI 上单独展示,明确标注"未评星参考"
- 详情页与榜单页均分离显示,避免与已评星机构直接可比
这比传统的"同类均值 imputation"更诚实——我们不知道它在哪档,就不假装知道。
为什么不用线性加权?
传统思路是"星级×0.55 + POI×0.20 + ... = 综合分"。但这种方法有两个结构性问题:
- 权重靠拍脑袋:为什么星级权重是 0.55 而不是 0.50?没有客观依据。
- 跨档混淆:加权下,一家"配套极好的三星"可能超过"配套一般的四星"——但实际家属决策中,星级就是粗门槛,不应被档内优势翻盘。
档位骨架 + 档内 TOPSIS 的组合,兼顾了"官方评级权威性"与"档内软性差异",同时用熵权法把权重决策交给数据本身。
为什么不算"用户评价"
我们采集了公开评价平台等平台的口碑数据,但 146 家机构中仅约 11% 存在有效评分样本。 贝叶斯平滑后,大多数机构的口碑分会被全市均分吞掉,反而稀释了其他维度的真实信号。 因此本季度我们决定不将口碑纳入综合分,仅在详情页单独呈现。待覆盖率显著提升后会重新引入。
评分多久更新一次
按季度重新计算一次并生成带版本号(当前为 2026Q2)的快照。 文章与榜单引用的都是快照版本,保证长期稳定。历史版本保留在数据库中以便对照追溯。
我们知道自己的局限
- 星级数据有滞后——民政局评定周期约 3 年一次,最新开业机构短期内不会出现星级
- 配套 POI 来自高德地图,无法反映配套质量,只能反映"是否存在"
- 价格字段来源混杂(官网/目录/电询),口径可能不完全可比;缺失价格机构用档内中位数填充
- 服务能力 6 字段来自 org_type 与 services 文本的关键词抽取,可能漏判(如某机构有医养但没写在简介里)
- 档内样本 < 3 时 TOPSIS 退化为统一 0.5 贴近度(如五星+ 仅 3 家,偏移很小)
- 负面扣分通道已预留,但目前数据源尚未接入(后续改为信用中国/消防跳转引导)
发现评分不合理? 欢迎机构、家属或业内人员通过详情页「信息纠错」入口指出问题,我们会在下一季度快照中修正。评分可以错,但不能不公开。