The theory and practice of community health portraits from the perspective of general practitioners
-
摘要: 用户画像作为一种实现精准个性化信息服务的工具,近年来受到广泛关注。用户画像是“基于用户真实数据的虚拟代表”,最重要的特性是真实性、动态性及独特性。基于不同画像构建角度,用户画像方法主要可分为基于本体画像、基于用户行为画像、基于主题画像、基于用户兴趣画像4种流派,其构建流程是一个用户特征数据采集、数据挖掘及过滤、标签提取及重组、丰富用户画像描述的过程,因其精准化、个性化服务的特点,用户画像可用于进行个性化推荐、精准营销、行为预测、异常检测等不同方向。社区画像是在用户画像的基础上对特定群体开展了前置的范围和边界确认,强调给定群体的共性特征,因此在研究内容和方法上有相应的区别。社区健康画像是社区画像在医疗卫生领域的延展,本质是一定区域内社区主体在医疗卫生领域的信息集合,可根据画像目的不同选择基于用户相似性画像或基于社区差异性画像,未来可应用于地区医疗资源分配、精准个性化医疗服务、医疗卫生服务水平评价、社区居民健康情况监测等方向。现有的社区健康画像研究较少且大多面向线上健康社区,但随着分级诊疗制度不断推进,数据支持技术不断更新,未来基层社区的医疗资源配置问题必将成为公共卫生领域的研究热点,社区健康画像的应用也会越来越多。本文介绍了当前用户画像、社区画像的研究进展和关键技术,并提出社区健康画像的概念、构建流程和方法及其应用前景,为进一步开展社区健康画像相关研究提供参考。Abstract: As a tool to achieve accurate personalized information service, user portrait has been widely concerned in recent years. User portrait is a "virtual representation based on the real data of users". The most important characteristics are authenticity, dynamics and uniqueness. Based on different portrait building point of view, the user portrait main methods can be divided into four kind of genre: portrait based on ontology, portrait based on user behavior painting, portrait based on themes, and portrait based on user interests. The build process is a user characteristic data acquisition, data mining and filtering, labels, extraction and the process of restructuring, rich user portrait description, because of its precision, the characteristics of personalized service, user portrait can be used for personalized recommendation, precision marketing, behavior prediction, anomaly detection and other directions. Community portrait is based on the user portrait of the specific group to carry out the front range and boundary confirmation, emphasizing the common characteristics of the given group, so there are corresponding differences in research content and methods. Community health portrait is the extension of community portrait in the field of health care, the essence is a certain area of community subject in the field of health care information collection, according to the different purposes of portrait based on user similarity portrait or based on the difference of the community portrait. In the future, it can be applied to regional medical resource allocation, precision and personalized medical service, medical and health service level evaluation, and community residents' health monitoring. However, with the continuous advancement of graded diagnosis and treatment system and the continuous updating of data support technology, the allocation of medical resources in grassroots communities will become a hot research topic in the field of public health in the future, and the application of community health portrait will also be more and more. This paper introduces the current research progress and key technologies of user portrait and community portrait, and puts forward the concept, construction process and method of community health portrait and its application prospect, which provides reference for further research on community health portrait. Keywords: Portrait; User data; Community health.
-
Key words:
- Portrait /
- User data /
- Community health
-
表 1 用户画像构建方法比较
构建方法 构建思维 优势 劣势 应用领域 基于本体画像 利用实体或概念中定义的结构化信息和关系信息刻画用户 该方法有较强的语义表达和逻辑推理能力,方便提升用户画像的准确率,本体的动态和静态信息可弥补社会化标签的不足 需要在不同条件下构建相应的本体结构,需耗费大量财力物力 图书馆、旅游业 基于用户行为 利用丰富的行为、历史记录数据等刻画用户 可获得丰富的用户个性化信息和不同用户行为模式的相似和差异比对信息 存在数据类型复杂庞大,无法很好地处理用户行为日志中的非理性因素等技术问题 图书馆、电子商务 基于主题画像 通过构建主题模型发现信息中隐含的主题刻画用户 该方法可以捕捉隐含的语义信息 无法在模型中体现用户本身的特征 社交平台 基于用户兴趣 通过历史经常关注、点击、行为等信息刻画用户 该方法利用不同用户相似的兴趣偏好排除了部分冗杂信息 对用户兴趣的动态性、实时性不能很好地把握,只能从有限的历史行为中估计用户的兴趣 电子商务、医疗健康 表 2 基于用户相似性的社区用户画像构建方法比较
构建方法 构架思路 优势 劣势 应用场景 基于单用户画像融合[21] 基于用户数据形成单用户画像,再将单用户画像融合生成具有代表性的典型用户画像 使用聚合策略,画像算法较简单 对于用户数据海量且多变的场景下效率低下且画像误差较大 社区用户数量较少的场景 基于社区行为[24] 通过分析用户行为数据,生成社区用户的行为特征,构建社区行为画像 可以得到丰富的社区用户内容和交互传播层面数据 用户数据的模糊性和随机性容易影响画像质量 社区用户行为相似度较高,用户群体大的场景 基于社区主题[25] 通过生成一系列主题刻画社区特征的画像 主题的产生和消失可及时反映社区的动态变化 社区主题的挖掘、关键词的结构化等问题受主观因素波动 社区主题呈动态变化,用户群体范围广的场景,大多适用于社交网络 基于社区传播[26] 从用户信息传播的角度刻画社区画像 揭示用户及社区的偏好,对合作预测、舆情监测有重要意义 难以克服用户传播数据的异质性问题 社区用户偏好、主题、行为较为相似的场景 表 3 基于社区差异性的社区用户画像构建方法比较
表 4 社区健康画像构建方法总结
构建方法 构架思路 基于行为 收集社区群体的就医行为数据,如就医频率、就医诊室、平均就医费用、就医医疗单位等信息,聚焦在就医行为本身,比对得出社区群体就医行为中的相似性和差异性继而刻画社区健康画像。 基于主体 主体包括社区居民和社区医疗单位两部分,居民信息包括居民的性别、年龄等个人基本信息,以及健康情况、社会关系等数据;医疗单位信息包括医疗人员分配、医疗部门配置、医疗资源情况等。通过刻画社区健康画像框架,一方面及时掌握区域居民的健康情况,另一方面了解社区卫生资源的使用情况,通过对医疗资源和居民医疗需求进行匹配研究开展卫生资源优化配置。但该构建方法动态弹性较低,适合构建稳定框架。 基于医疗主题 结合医疗卫生特征和主题分类特点,可制定相应的社区健康主题模型,例如设置“发热筛查”“症状描述”“治疗方案”“社会支持”等子主题,将收集到的医疗健康信息进行聚类,开展主题模型分析,刻画社区健康画像。该构建方法主要适用于在线健康社区,通过健康社区中的主题词和提及频率判断用户的医疗需求和现有医疗系统中的问题。 基于卫生需求 收集社区居民的就医需求数据,如诊疗需求、护理需求、健康咨询需求等,通过分析居民相似的需求排除其他冗杂的信息,刻画社区画像框架,通过对主要需求的聚类和分析,通过与现有的医疗资源分布和使用状况进行对比,判断医疗资源分配的合理性。 基于社区差异性 通过分析社区用户之间以及社区与社区之间的医疗卫生情况的差异对不同区域人群的医疗卫生情况进行区分比较,可作为上级卫生管理机构评价社区医疗卫生情况的重要参考。 -
[1] 程雅娟, 王尚才. 高龄老人居家养老健康管理需求及制约因素研究[J]. 中国医药, 2021, 16(3): 448-451. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGYG202103031.htm [2] 国家统计局, 国务院第七次全国人口普查领导小组办公室. 第七次全国人口普查公报[N]. 中国信息报(2021-05-12).http://www.stats.gov.cn/ztjc/zdtjgz/zgrkpc/dqcrkpc/ggl/202105/t20210519_1817696.html. [3] 邓晓, 邱莎莎. "互联网+"环境下分级诊疗制度的模式及运行机制探讨[J]. 现代商贸工业, 2021, 42(8): 69-70. https://www.cnki.com.cn/Article/CJFDTOTAL-XDSM202108030.htm [4] 赵茜, 陈华东, 伍佳, 等. 我国基层医疗体系的发展与展望[J]. 中华全科医学, 2020, 18(3): 341-346. https://www.cnki.com.cn/Article/CJFDTOTAL-SYQY202003001.htm [5] 郭燕红. 推进分级诊疗, 构建连续健康服务[J]. 中国全科医学, 2017, 20(1): 1-5. doi: 10.3969/j.issn.1007-9572.2017.01.001 [6] 江凌凌, 聂政, 孟玲. 分级诊疗模式下成都市社区基层医疗卫生服务中心慢性病管理现状及对策研究[J]. 成都医学院学报, 2020, 15(6): 793-795. doi: 10.3969/j.issn.1674-2257.2020.06.028 [7] 徐芳, 应洁茹. 国内外用户画像研究综述[J]. 图书馆学研究, 2020(12): 7-16. https://www.cnki.com.cn/Article/CJFDTOTAL-TSSS202012002.htm [8] QUINTANA R M, HALEY S R. The persona party: Using personas to design for learning at scale[J]. Chi Conference Extended, 2017: 933-941. http://dl.acm.org/ft_gateway.cfm?id=3053355&type=pdf [9] 梁荣贤. 基于用户画像的图书馆精准信息服务研究[J]. 图书馆工作与研究, 2019(4): 65-69. https://www.cnki.com.cn/Article/CJFDTOTAL-TSGG201904012.htm [10] 许鹏程, 毕强, 张晗, 等. 数据驱动下数字图书馆用户画像模型构建[J]. 图书情报工作, 2019, 63(3): 30-37. https://www.cnki.com.cn/Article/CJFDTOTAL-TSQB201903009.htm [11] 宋美琦, 陈烨, 张瑞. 用户画像研究述评[J]. 情报科学, 2019, 37(4): 171-177. https://www.cnki.com.cn/Article/CJFDTOTAL-QBKX201904027.htm [12] 刘海鸥, 孙晶晶, 苏妍嫄, 等. 基于用户画像的旅游情境化推荐服务研究[J]. 情报理论与实践, 2018, 41(10): 87-92. https://www.cnki.com.cn/Article/CJFDTOTAL-QBLL201810014.htm [13] 陈晶. 移动数字图书馆用户画像模型及其情境化推荐方法研究[J]. 图书馆学研究, 2018(4): 19-23. [14] 高广尚. 用户画像构建方法研究综述[J]. 数据分析与知识发现, 2019, 3(3): 25-35. https://www.cnki.com.cn/Article/CJFDTOTAL-XDTQ201903003.htm [15] 费鹏, 林鸿飞, 杨亮, 等. 一种用于构建用户画像的多视角融合框架[J]. 计算机科学, 2018, 45(1): 179-182, 204. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJA201801034.htm [16] 林燕霞, 谢湘生. 基于社会认同理论的微博群体用户画像[J]. 情报理论与实践, 2018, 41(3): 142-148. https://www.cnki.com.cn/Article/CJFDTOTAL-QBLL201803027.htm [17] 王顺箐. 以用户画像构建智慧阅读推荐系统[J]. 图书馆学研究, 2018(4): 92-96. https://www.cnki.com.cn/Article/CJFDTOTAL-TSSS201804013.htm [18] 赵雅慧, 刘芳霖, 罗琳. 大数据背景下的用户画像研究综述: 知识体系与研究展望[J]. 图书馆学研究, 2019(24): 13-24. https://www.cnki.com.cn/Article/CJFDTOTAL-TSSS201924002.htm [19] 杜娜娜. 基于社交媒体的短文本数据挖掘研究[D]. 天津: 天津理工大学, 2018. [20] 汪倩, 徐勇, 张心蕊, 等. 用户画像研究进展综述[J]. 现代计算机, 2020(24): 60-63. doi: 10.3969/j.issn.1007-1423.2020.24.011 [21] 刘蕾蕾, 王胜涛, 胡正银. 社区画像研究综述[J]. 图书情报工作, 2019, 63(23): 122-130. https://www.cnki.com.cn/Article/CJFDTOTAL-TSQB201923021.htm [22] AKBARI M, CHUA T S. Leveraging behavioral factorization and prior knowledge for community discovery and profiling[C]//Proceedings of the tenth ACM international conference on web search and data mining. New York: ACM, 2017: 71-79. [23] CAI H Y, ZHENG V W, ZHU F W, et al. From community detection to community profiling[J]. Proc VLDB Endow, 2017, 10(7): 817-828. doi: 10.14778/3067421.3067430 [24] 姚龙飞, 何利力. 基于云模型理论的群体用户画像模型[J]. 计算机系统应用, 2018, 27(6): 53-59. https://www.cnki.com.cn/Article/CJFDTOTAL-XTYY201806008.htm [25] 张海涛, 崔阳, 王丹, 等. 基于概念格的在线健康社区用户画像研究[J]. 情报学报, 2018, 37(9): 912-922. doi: 10.3772/j.issn.1000-0135.2018.09.006 [26] CAI H Y. Making sense of social events by event monitoring, visualization and underlying community profiling[D]. Queensland: The University of Queensland, 2016. [27] 陈鼎. 用大数据为健康城市"画像"[N]. 中国青年报, 2020-09-08(10).
计量
- 文章访问数: 325
- HTML全文浏览量: 195
- PDF下载量: 35
- 被引次数: 0