2019年11月10日召开的“第五届中国慢性病与信息大会”吸引了近500人的关注,包括国家卫生与健康委员会领导、各级医疗机构和体检机构领导、社区卫生服务中心领导、康复机构领导、疾病控制与预防系统专业人员领导、医学院校和科研机构领导、医疗卫生服务企业领导。双方共同讨论了慢性病综合防控、慢性病防控国际经验、慢性病防控信息化、5G智能健康等主题。解密了信息技术对健康中国慢性病防治的驱动力。
北方医科大学第三医院临床研究中心李楠博士在会议报告会上发表了题为“从下到需求的快速证据输出的数据支持”的演讲。
数据智能研究中心

谢谢大家。很荣幸有机会与您分享我们非常微观的话题和经验。在此之前,许多领导人和前任从宏观角度说,健康大数据的机遇在哪里,可以做些什么。他们确实在这个领域进行了研究,以实现健康大数据的功能,包括谁是使用大数据生成证据的人,也许更多的是基层从业者。他们想应用这个东西。应用它们时有什么要求和问题?我们在前线做了一些工作,也有一些小经验。让我们和你分享它们。我希望你们前辈能批评和纠正我。
我们自己的需求是什么?我们认为现在最核心的需求是如何在数据的支持下,根据实际需要快速输出一些证据。目前,无论是公共卫生问题还是慢性病患者的临床干预,都需要证据来指导实践。许多研究者在这个领域经常有想法。我们有这个领域的信息就足够了,有数据就足够了。数据输入后,我们当然可以指导实践。在数据面前已经感受到的实践经验可能不那么重要,甚至从大数据分析中获得的结论也直接代表了现实世界的场景。当我觉得数据不够大,并且有一个孤立的信息孤岛时,它对一线工人没有什么用处空。我还觉得,面对海量数据,一线研究人员不再有能力领导面向需求的证据输出研究。
是这样吗?这背后有什么问题吗?由“需求”驱动的证据进展始于一个小例子。如何看待需求驱动的证据进展?这个病例是我在实际工作中参与慢性病研究时遇到的。一位研究人员提出了一套慢性病管理的想法,他认为非常有效。缺血性卒中后,卒中后幸存的人已经进入慢性病管理的范畴,因为卒中、痴呆、身体残疾和随后的疾病费用的复发是一系列相当大的问题,其中最重要的是复发事件,这些事件非常严重,三年内达到25%,一些文章报道了五年内复发率接近50%。对于慢性病一线管理者来说,最重要的问题是如何有效地进行二级预防,以及如何有效地控制复发的风险。
面对这样的问题,现在没有证据吗?根据以前对慢性病的研究,证据的数量非常大。包括急性期二级预防是否有效,康复期的定期监测是否能进一步降低复发风险,卒中预防、降压、降脂和抗斑块三大基石,如何达到实际标准,患者复发风险模型的构建,以及长期应用架空药物的健康经济评价,这些问题都得到了全面回答。然而,这些问题在实际工作中有用吗?许多一线工作者会觉得没有地方放置这样的证据。真正实践过程中的难点在哪里?证据真的符合痛点吗?
我们不妨分析一下对证据本身的真正需求,看看需要什么样的证据。对这位研究人员来说,他面临的SWOT就是这样一个框架。
优势是核心组织。有许多医学协会单位支持我。医学会社区平台是其优势。核心医院的诊疗是其技术优势。他已经有了成功的经验。他在一个非常优秀的社区进行了示范,发现他可以在三年内将复发率降低25%至5%。缺点是什么?所有干预社区都没有完整的随访信息,也不能进行回顾性研究。同时,机构间数据是孤立的。虽然有许多医疗助理,但他们无法获得其他人的数据。这种医学协会模式在全国范围内是否广泛传播,有哪些机遇,因此,如何在这种模式下开展二级预防,是每个人都非常关心的问题。高风险群体是可以识别的,有各种模型。核心医疗机构可以接受基于识别高危人群的有针对性的早期干预,以降低复发风险。真正的威胁是当前的威胁。长期干预是不现实的,将人们安置在核心医院也是不现实的。
面对这种情况,对证据的真正需求是否仍然和以前一样?它似乎变了。我们的要求是什么?如何在有限的工作量下降低控制疾病复发的难度,我们应该做到可行,不是没有证据,而是没有这样的证据。潜在的证据是什么?识别复发高危人群并进行准确的二级预防真的有效吗?回答这些问题的第一选择必须是使用现有数据。在现有的医学会框架下,上海申康系统等省市已经可以很好地回答这个问题。
还有其他选项可以用作队列,包括这种模式在不同管理模式下是否优于其他模式,或者进行干预研究,看看新模式和传统模式是否能真正有效地控制某些社区的复发率。当然,研究人员最终选择的方案并不是最优的。应用大数据方法来评估计划的有效性,但要做RCT这个最困难的群体,为什么要这样做?缺点太明显了,随访信息不完整,即使我们做前瞻性研究,也不可能在现有数据库中调出随访信息。同时,机构间数据的隔离也是最大的问题。尽管基于大数据进行评估或构建新的慢性病管理模式在理论上是可行的,但当我们真正将这个问题和资源投入一线工作者时,我们将发现难以实施。即使我们这样做了,结论的可靠性仍然受到怀疑。
当前的困境是什么?现有证据与实际工作脱节。我们希望,当我们通过现有数据生成满足实际需求的新证据时,我们会发现数据质量和证据需求也是脱节的。两者之间的脱节是当前一线工作面临的最大问题。在大数据的情况下,如何转换和生成新的证据,应该有什么困难和对策,虽然数据是存在的,但数据和可用数据并不等同。我们所看到的是,慢性病患者数量庞大,包括EHRs建设在内的信息系统越来越完善。10月,我去日本参加亚太地区药物流行病学年会。我看到了一个非常悲伤的现实。日本、韩国、台湾,甚至印度都进行了大量的研究。很少有证据表明,基于EHRs的资源能够真正从中国获得,这与我们的身体大小不一致。
我们的瓶颈在哪里?为了解决瓶颈问题,我们实际上在参加亚太年会之前完成了这部分工作。这是一篇发表于2019年的文章。本文讨论的问题是什么?已经进行了定性研究,以分析阻碍一线工作人员应用现有数据提供证据的障碍。这篇文章很小,只包括19个受试者,19个受试者是用最大差异法选出的,他们被问及他们认为背后有什么障碍和机会。最后总结的障碍如下:第一个框架的障碍和最后一个框架的障碍,对他们来说,一个是他们没有时间这样做,另一个是他们不会这样做。即使你给我资源,我也不知道怎么做。撇开这两个框架不谈,中间的所有问题都围绕着数据的可访问性和质量。缺乏信息、数据不一致、检索繁琐、非结构化和难以识别个人是阻碍他们使用大数据来产生证据的核心缺陷,即所谓的数据缺陷。反过来,我们问他们,他们给了我们非常否定的回答。有缺陷的数据不能提供证据吗,或者我们需要的证据必须足够完美以指导实践?好像没有。
第二个问题是,有缺陷的数据真的等同于无效信息吗?有时候不是。当真的需要证据时,它可以帮助我们回答一些问题。例如,在慢性病中,常见的慢性病是老年患者,电子病历不完整,许多患者不来。然而,老年慢性病患者的信息通常是完整的。复发和入院问题必须在核心医疗机构解决。这些慢性病缺乏标准化的临床数据,数据量大,随访不完整。事实上,我们仍然可以在各种不完美的数据中找到相对可靠的数据,即使信息量有限,相对可靠的数据也不是完全无用的。例如,也许我们只能找到处方数据,却不能回答潜在的因果关系?虽然我们不能回答因果关系,但这种关系总是可以建立的。例如,我们可以简单地根据处方数据挖掘一些证据。这种方法是自20世纪70年代和80年代以来建立起来的一种非常成熟的方法。如果无法获得患者的结果,是否仍无法获得与患者相关的处方和结果?如果不能获得患者的复发性中风,则总是可以获得由患者的复发性中风引起的再入院诊断。事实上,您只有通过处方或付款相关数据才能建立相关性。
分析过程也非常简单,当然也有其局限性。至少它可以回答非常明确的相关替代,如抗生素和感染,特定激素和过敏,血管内治疗和血栓形成。它的缺点是,只有当你的处方不同时,你才能回答慢性病干预和结果之间的相关性。如果没有区别,每个人都是一套计划,难道没有办法去评价它吗?还有一种方法可以评估类似于处方序列对称分析的策略。代表我们干预的“A”计划和代表我们结果的“B”药物的前后对称是否已经被及时打破,谁先来谁后是随机的。如果你明白干预后总是会出现新的相应补救措施意味着什么,你的干预必然会带来问题。如果在你干预前它总是有意义的,你的干预可能会解决问题并提供证据支持干预。
当然,一些非常经典的应用也可以探索新药适应症,例如,日本研究人员提出了一套数据挖掘框架,明确指出当提出新药适应症时,如处方序列对称分析非常有效,而且非常简单,而且信息需求非常少。这个场景也是我自己的研究。许多慢性病领域都说使用长效药物可以提高患者的依从性,从而带来更好的结果。精神分裂症通常没有假药。这一领域的长效药物真的能促进患者的康复吗?我不知道。因此,我们提出了这个问题,并发现了精子稳定的患者,其中一些人已经改为长效注射,一些人没有改为长效注射。此时所有的药物患者都已转为长效注射剂。结果是观察长效注射是否会中断患者的再入院。我们做了一系列的分析,没有找到结论。因为即使是单臂研究也能提供任何信息,我们也对处方顺序进行了对称分析,没有得出结论,这与一线慢性病管理人员的经验不一致,后者得出结论,接受长效注射的患者的复发率降低了。我们看不到这种现象。数据太粗略了。我们做什么呢我们做了一个小小的尝试。PSSA处方序列分析完全变成了一种新方法。我们没有亲自验证。我们计划今年特别进行验证。
对于医疗机构来说,一些医疗机构可以使用该平台。许多医疗机构在电子病历上花了很多钱。它背后有一个数据清理和挖掘系统。对于非医疗机构的人或电子病历建立不完善的机构,三方平台又如何呢?为了解决这个问题,国内第三方制造商做了一些尝试。零研究技术平台非常好。他们需要做的正好符合我们的需要。通常他们需要快速输出证据。他们只想清理数据。终点是证据输出,最后发表论文。对于一线工作者来说,如何理清思路才是真正的症结所在。这个平台特别擅长于整合第一步,不是从数据开始,而是从问题开始,并采用我们在临床研究中经常使用的概念。微微,研究人员需要数据,做分析,不要先做,然后回去构建一个假设。假设有各种支持系统,然后进行数据清理和统计分析,这样可以更好地实现所获得的东西。
我们已经清楚地看到,许多像我们医院这样的研究人员开始基于电子病历进行输出,包括光盘系统。信用违约互换评估也在产生结果,其他医院的研究人员也在慢慢利用第三方平台。这时,我们将回到观点会有一些新想法的前提,有什么新想法。事实上,对高质量证据输出的需求比数据本身更重要。实践是发现证据需求和提出创新点的源泉。数据质量限制了证据输出的效率。与此同时,我们不应该忘记也有低质量的数据。当我们看到技术难度限制了应用的普及时,核心出发点是考虑数据质量以及如何突破技术难度的瓶颈,降低技术难度,支持一线研究,从而促进更多的证据从一线需求中输出。
谢谢大家。