建局域网网站,个人主页介绍模板,肇庆网站开发哪家专业,网站建设英文参考文献一、引言 
1.医疗数据抽取与 Informatica 概述 
1.1 医疗数据的特点与来源 
1.1.1 数据特点 
医疗数据具有显著的多样性特点。从数据类型来看#xff0c;涵盖了结构化数据#xff0c;如患者的基本信息、检验检查结果等#xff0c;这些数据通常以表格形式存储#xff0c;便于… 一、引言 
1.医疗数据抽取与 Informatica 概述 
1.1 医疗数据的特点与来源 
1.1.1 数据特点 
医疗数据具有显著的多样性特点。从数据类型来看涵盖了结构化数据如患者的基本信息、检验检查结果等这些数据通常以表格形式存储便于查询和分析半结构化数据像电子病历中的文本描述部分虽有一定结构但不完全规范以及非结构化数据例如医学影像X 光片、CT 扫描等、音频听诊记录和视频手术过程录像等。这些不同类型的数据为医疗研究和临床决策提供了丰富的信息维度但也增加了数据处理的难度。 
医疗数据的复杂性体现在其内部的关联关系错综复杂。患者的诊断结果往往与多种因素相关包括症状表现、病史、家族遗传、检验指标以及治疗过程等。这些因素相互交织形成了复杂的因果网络。例如一位患有心血管疾病的患者其治疗方案不仅取决于当前的病情症状和检查指标还需考虑患者的过往病史、家族中是否有类似疾病以及药物过敏史等任何一个因素的变动都可能影响最终的治疗决策。 
医疗数据的时效性至关重要。在医疗领域患者的病情随时可能发生变化例如生命体征的实时监测数据、疾病的进展情况等。以急性病患者为例如急性心肌梗死患者其发病初期的各项生理指标变化迅速及时获取这些数据对于医生准确判断病情、制定紧急治疗方案至关重要。过时的数据可能导致误诊或延误治疗严重影响患者的生命健康。 
医疗数据包含大量患者的个人隐私信息如姓名、身份证号、联系方式、疾病诊断等这些信息一旦泄露将对患者的个人权益造成严重损害。依据《健康医疗数据安全指南》等相关法规医疗机构和相关企业必须采取严格的安全措施如数据加密、访问控制、权限管理等以确保医疗数据的隐私安全。 
1.1.2 数据来源 
医院信息系统HIS是医疗数据的重要来源之一它涵盖了医院的各个业务环节包括门诊管理、住院管理、药品管理、财务管理等。在门诊管理中HIS 系统记录了患者的挂号信息、就诊记录、医生开具的处方等住院管理方面包含患者的入院登记、床位分配、医嘱执行情况、护理记录以及出院结算等数据。这些数据全面反映了医院的日常运营和患者的就医过程。 
电子病历系统EMR详细记录了患者的诊疗过程包括主诉、现病史、既往史、体格检查、诊断结果、治疗方案以及病情变化等信息。医生在诊疗过程中会将患者的详细情况录入到 EMR 系统中为后续的医疗决策提供了重要依据。而且EMR 系统的普及使得患者的病历信息能够实现电子化存储和共享方便医生随时查阅和参考。 
影像归档和通信系统PACS主要存储和管理医学影像数据如 X 光、CT、MRI 等。这些影像数据对于疾病的诊断和治疗具有不可替代的作用。例如在肿瘤诊断中医生通过对 CT 影像的分析可以准确判断肿瘤的位置、大小、形态以及与周围组织的关系从而制定出精准的治疗方案。 
1.2 ETL 技术原理与流程 
1.2.1 ETL 概念解析 
ETL 即抽取Extract、转换Transform、加载Load的缩写是一种用于数据集成和处理的关键技术。在医疗数据处理领域其重要性不言而喻。抽取环节是从多个不同的医疗数据源中获取数据。这些数据源涵盖医院信息系统HIS、电子病历系统EMR、影像归档和通信系统PACS等。例如从 HIS 系统中抽取患者的基本信息包括姓名、性别、年龄、住院号等从 EMR 系统中抽取患者的诊疗记录如症状描述、诊断结果、治疗方案等从 PACS 系统中抽取医学影像数据的相关元信息如影像拍摄时间、设备型号、患者体位等。在这个过程中需要根据不同数据源的特点运用相应的技术手段来实现数据的抽取。 
转换环节是对抽取到的原始数据进行一系列处理以使其符合目标数据的格式和质量要求。这一环节涉及到数据清洗、格式转换、数据标准化等多个方面。数据清洗旨在去除数据中的噪声和错误如纠正错误的出生日期、填补缺失的检验结果等。格式转换则是将不同数据源中多样化的数据格式统一为目标格式例如将不同系统中日期的表示形式统一为 “YYYY - MM - DD” 的标准格式。数据标准化是使数据具有一致性和可比性像将不同医院对疾病的编码统一为国际标准的疾病分类编码ICD - 10。 
加载环节是将经过转换处理后的数据加载到目标数据库或数据仓库中。在医疗数据处理中目标存储通常是专门构建的医疗数据仓库用于存储和管理大量的医疗数据以便后续的数据分析和挖掘。在加载过程中需要考虑数据的存储方式、索引设置等因素以确保数据能够高效地被查询和分析。例如合理设计数据仓库的表结构为常用查询字段创建索引从而提高数据查询的速度。 
1.2.2 ETL 流程步骤 
在多医疗平台数据抽取中ETL 流程的第一步是数据源连接。这一过程需要针对不同类型的医疗数据源使用相应的连接技术和工具。对于关系型数据库如医院信息系统HIS常用的 SQL Server、Oracle 等数据库可通过相应的数据库驱动程序进行连接。以连接 SQL Server 数据库为例需要在 Informatica 中配置数据库的服务器地址、端口号、数据库名称、用户名和密码等信息确保能够建立稳定的连接。对于文件系统中的数据如电子病历系统EMR生成的文本文件、CSV 文件等可通过文件读取接口进行连接。在连接过程中需要指定文件的存储路径、编码格式等参数以确保能够正确读取文件中的数据。对于基于云的医疗数据服务如某些远程医疗平台的数据存储在云端需使用云服务提供商提供的 API 接口进行连接。在配置连接时需要提供相应的 API 密钥、访问令牌等认证信息以实现安全的数据访问。 
数据抽取是 ETL 流程的关键步骤之一可根据数据的特点和需求采用全量抽取或增量抽取的方式。全量抽取适用于首次数据抽取或数据源数据量较小的情况它将数据源中的所有数据一次性抽取到目标存储中。例如在构建新的数据仓库时对历史积累的医疗数据进行全量抽取以便完整地保存和分析这些数据。增量抽取则是仅抽取自上次抽取以来发生变化的数据这种方式能够有效减少数据传输量和处理时间提高数据抽取的效率。例如在日常的数据更新过程中通过监测数据源中数据的变化时间戳或日志信息只抽取新增或修改的数据记录。在进行数据抽取时还需要根据业务需求编写 SQL 查询语句或使用 Informatica 提供的图形化工具来定义抽取规则。例如根据患者的就诊时间范围、科室等条件从 HIS 系统中抽取特定时间段内某科室的患者诊疗数据。 
数据转换是 ETL 流程的核心环节通过多种转换操作来提高数据的质量和可用性。数据清洗是去除数据中的重复记录、处理缺失值和纠正错误数据。例如使用 Informatica 的去重组件根据患者的唯一标识如身份证号或住院号去除重复的患者信息记录对于缺失的检验结果数据根据业务规则进行填补如使用同类型患者的平均值或根据相关数据进行预测填补。数据标准化是将数据转换为统一的格式和标准如将不同医院使用的药品名称统一为标准的药品通用名将不同地区的地址格式统一为规范的地址表示形式。数据计算和聚合是根据业务需求进行数据的计算和汇总例如计算患者的住院天数通过出院日期减去入院日期得到对某科室的医疗费用进行汇总统计以便分析科室的收入情况。在 Informatica 中可使用表达式转换组件来编写数据转换逻辑使用聚合转换组件进行数据的汇总计算使用查找转换组件进行数据的匹配和关联。 
数据加载是将转换后的数据加载到目标数据库或数据仓库中。在加载之前需要对目标表进行创建和配置确保其结构与转换后的数据相匹配。在加载过程中可根据数据量和业务需求选择合适的加载方式如批量加载或实时加载。批量加载适用于数据量较大的情况能够提高加载效率通常在夜间或系统空闲时段进行以减少对业务系统的影响。实时加载则适用于对数据及时性要求较高的场景如实时监测患者的生命体征数据一旦有新的数据产生立即加载到目标存储中以便医生能够及时获取最新信息。在 Informatica 中可通过配置目标定义和映射关系将转换后的数据准确无误地加载到目标表中。同时还需要考虑数据加载的性能和可靠性如设置合理的事务处理机制确保数据加载的完整性和一致性。 二、多医疗平台数据抽取需求分析 
2.1 不同医疗平台数据特点及差异 
医院信息系统HIS的数据结构通常围绕医院的业务流程进行设计涵盖多个模块如患者管理、诊疗管理、药品管理、财务管理等。每个模块都有相应的数据库表各表之间通过主键和外键建立关联关系。在患者管理模块中患者基本信息表存储了患者的姓名、性别、年龄、身份证号等基本信息而患者就诊记录表则通过患者 ID 与患者基本信息表关联记录患者的就诊时间、科室、医生等信息。 
HIS 系统的数据格式较为规范多为结构化数据以关系型数据库的表结构形式存储。日期格式通常采用 “YYYY - MM - DD” 的标准形式数值型数据也有明确的字段类型和精度定义。在财务数据中金额字段通常定义为具有两位小数的十进制类型以确保数据的准确性和一致性。 
HIS 系统在编码体系方面可能采用多种编码方式。对于疾病诊断可能使用国际疾病分类编码ICD - 10但在医院内部也可能存在自定义的疾病代码用于快速检索和统计。药品编码方面可能采用国家药品编码同时也保留医院内部的药品编号以方便药品管理和库存控制。这就导致在数据抽取和整合时需要对不同编码体系进行映射和转换以确保数据的一致性和准确性。 
电子病历系统EMR的数据结构以患者的病历信息为核心包含了患者的主诉、现病史、既往史、体格检查、诊断结果、治疗方案、医嘱等多个部分。这些信息通常以文本形式记录同时也包含一些结构化的数据如检查检验结果、生命体征数据等。病历信息可能按照时间顺序进行存储形成一个完整的患者诊疗过程记录。 
在数据格式上EMR 系统的数据具有较大的灵活性。文本部分通常为自由格式医生可以根据实际情况进行详细的描述这就导致文本数据的格式和长度各不相同。而结构化数据部分如检查检验结果可能采用不同的格式表示有些结果以数值形式呈现有些则以文本描述的方式记录。在血常规检查结果中红细胞计数、白细胞计数等指标以数值形式记录而血型等信息则以文本形式表示。 
EMR 系统在编码体系上对于疾病诊断和手术操作等信息通常采用国际或国内通用的编码标准如 ICD - 10 和手术操作分类编码ICD - 9 - CM - 3。但在一些特殊情况下医院可能会根据自身的需求对某些疾病或操作进行自定义编码。这就要求在数据抽取过程中要对这些编码进行准确的识别和转换以保证数据的通用性和可分析性。 
实验室信息管理系统LIS的数据结构主要围绕实验室的检验流程进行构建包括标本管理、检验项目管理、检验结果管理等模块。标本信息表记录了标本的采集时间、采集人、患者信息等检验项目表定义了各种检验项目的名称、代码、参考范围等信息检验结果表则存储了患者的具体检验结果数据。 
LIS 系统的数据格式以结构化数据为主检验结果通常以数值或特定的代码形式表示。在生化检验中血糖、血脂等指标以数值形式呈现而一些定性检验结果如乙肝五项检查结果可能以阳性、阴性或特定的代码表示。日期和时间格式也有明确的规定通常精确到分钟甚至秒以确保检验结果的时效性和准确性。 
在编码体系方面LIS 系统对于检验项目和结果的编码通常采用行业标准编码如临床检验项目分类与代码WS/T 482 - 2016等。这样可以保证不同实验室之间的数据具有可比性和互操作性。但在实际应用中由于不同厂家的 LIS 系统可能存在差异或者医院对某些特殊检验项目进行了自定义编码因此在数据抽取时需要对编码进行仔细的核对和转换以确保数据的一致性。 
2.2 数据抽取的业务需求与目标 
2.2.1 临床决策支持需求 
在临床诊疗过程中医生急需全面且准确的患者数据以辅助诊断与治疗决策。完整的患者病史信息包括既往疾病诊断、治疗过程、过敏史等对医生判断当前病情的发展和制定合适的治疗方案至关重要。以一位患有心脏病的患者为例医生需要了解其过往心脏病发作的次数、治疗方法、使用过的药物以及是否存在药物过敏等情况才能准确评估病情并制定出最适宜的治疗方案。详细的检查检验结果如血液检查、影像学检查X 光、CT、MRI 等、病理检查等能够为医生提供直观的病情证据帮助其明确疾病的类型、程度和范围。对于癌症患者病理检查结果可以确定肿瘤的性质、分期等关键信息从而决定后续的治疗策略是手术、化疗还是放疗。实时的生命体征数据如心率、血压、体温、呼吸频率等能够反映患者的即时健康状况及时发现病情的变化以便医生迅速采取相应的治疗措施。在重症监护室中医生通过持续监测患者的生命体征能够及时发现患者病情的恶化趋势提前进行干预挽救患者的生命。 
为了满足这些需求需要从多个医疗平台抽取数据。从电子病历系统EMR中获取患者的病史记录、症状描述、诊断结果等信息这些信息是医生了解患者病情的基础。从实验室信息管理系统LIS中抽取检查检验结果数据确保数据的准确性和及时性。从医疗设备监测系统中获取患者的实时生命体征数据实现对患者健康状况的实时监控。通过对这些数据的整合和分析为医生提供一个全面、准确的患者数据视图辅助医生做出更加科学、合理的诊断和治疗决策提高医疗质量和治疗效果。 
2.2.2 医院管理决策需求 
医院管理者在进行运营决策时需要大量的运营数据作为支撑。这些数据涵盖多个方面包括患者流量数据通过分析不同时间段、不同科室的患者就诊人数医院管理者可以合理安排医疗资源如调配医护人员、调整床位数量等。在流感高发季节呼吸内科的患者流量会大幅增加医院管理者可以提前调配更多的医护人员到该科室确保患者能够得到及时的救治同时根据患者流量情况合理调整床位分配提高床位的利用率。医疗资源使用情况数据包括设备的使用频率、药品的消耗情况等有助于管理者了解资源的使用效率优化资源配置。对于使用频率较低的医疗设备管理者可以考虑是否需要减少采购数量或进行设备共享对于常用药品的消耗情况管理者可以根据数据分析结果制定合理的药品采购计划避免药品积压或缺货。财务数据如医疗收入、成本支出等对医院的财务管理和成本控制至关重要。管理者通过分析财务数据能够了解医院的经济状况制定合理的收费标准控制医疗成本提高医院的经济效益。通过对不同科室的医疗收入和成本支出进行分析管理者可以发现哪些科室的盈利能力较强哪些科室需要进一步优化成本结构从而有针对性地进行管理决策。 
为了支持这些决策需要从医院信息系统HIS、财务管理系统等平台抽取相关数据。从 HIS 系统中获取患者的挂号信息、住院信息、诊疗记录等这些数据可以反映患者流量和医疗资源的使用情况。从财务管理系统中抽取财务数据包括收入明细、支出明细等为医院的财务管理和成本控制提供数据支持。通过对这些数据的深入分析医院管理者可以制定出科学合理的资源配置计划、绩效评估体系和成本控制策略提高医院的运营效率和管理水平为医院的可持续发展提供有力保障。 
2.2.3 科研数据需求 
医学研究需要高质量的数据作为基础以支持疾病研究、临床试验等工作。在疾病研究方面大量的患者病历数据、基因数据、影像数据等能够帮助研究人员深入了解疾病的发病机制、遗传因素、疾病的演变过程等。通过对大量癌症患者的病历数据和基因数据进行分析研究人员可以发现某些基因突变与特定癌症的发生之间的关联从而为癌症的早期诊断和治疗提供新的靶点。临床试验数据包括患者的入选标准、治疗方案、治疗效果评估等对于评估新药物、新治疗方法的有效性和安全性至关重要。在新药研发过程中临床试验数据可以帮助研究人员确定药物的疗效、副作用等关键信息为药物的审批和上市提供依据。 
为了满足科研需求需要从多个医疗平台抽取数据。从电子病历系统EMR、临床研究管理系统等平台抽取患者的病历数据、临床试验数据等。在抽取过程中要确保数据的准确性、完整性和一致性同时要注意保护患者的隐私。对患者的个人身份信息进行加密处理在数据使用过程中严格遵守相关法律法规和伦理规范确保患者的权益得到充分保障。通过对这些数据的整理和分析为医学研究提供可靠的数据支持推动医学科学的发展和进步。 
2.3 数据质量要求与挑战 
2.3.1 数据准确性要求 
在医疗领域数据的准确性犹如基石般重要直接关系到患者的生命健康和医疗决策的正确性。以患者信息为例患者的姓名、性别、年龄、身份证号等基本信息必须准确无误。若患者年龄登记错误可能导致医生在诊断和治疗过程中因参考了错误的年龄因素而对疾病的判断出现偏差。在判断儿童的生长发育情况时准确的年龄信息是关键依据错误的年龄可能导致对儿童生长发育状况的误判进而影响治疗方案的制定。 
诊断结果的准确性更是关乎患者的治疗方向和预后。医生依据各种检查检验结果、症状表现等做出的诊断必须精确可靠。在癌症诊断中若病理报告的诊断结果出现错误将使患者面临错误的治疗方案。若将良性肿瘤误诊为恶性肿瘤患者可能会接受不必要的手术、化疗或放疗承受巨大的身体痛苦和经济负担反之若将恶性肿瘤误诊为良性可能会延误患者的最佳治疗时机导致病情恶化严重威胁患者的生命安全。 
2.3.2 数据完整性挑战 
数据完整性是医疗数据质量的重要保障然而在实际的数据抽取过程中面临着诸多挑战。数据缺失是常见问题之一在患者的病历记录中可能会出现某些检查检验结果缺失的情况。在一些基层医疗机构由于设备故障或操作失误可能导致某些检验项目无法正常进行从而使患者的检验报告中缺少相关数据。一些患者可能因各种原因未能完成全部检查项目导致病历中部分检查结果缺失。这可能会影响医生对患者病情的全面评估导致诊断不准确或治疗方案不完整。 
数据重复也是影响数据完整性的一个重要因素。在不同医疗平台的数据整合过程中由于系统之间的数据同步不及时或数据录入不规范可能会出现患者信息重复的情况。同一患者在不同时间到同一家医院就诊由于挂号系统与住院系统之间的数据没有及时更新和同步可能会导致患者的基本信息在两个系统中重复录入。这不仅会占用大量的存储空间还会给医生的诊断和治疗带来困扰增加医疗差错的风险。 
2.3.3 数据一致性难题 
不同医疗平台的数据编码和术语不一致是一个棘手的难题。在疾病诊断方面不同医院或地区可能采用不同的疾病编码体系。虽然国际上有通用的疾病分类编码ICD - 10但在实际应用中部分医院可能会根据自身需求对某些疾病进行自定义编码。这就使得在数据整合时难以准确地将不同编码体系下的疾病信息进行关联和分析。在药品名称方面存在商品名、通用名等多种称呼不同平台对药品的命名方式可能各不相同。同一种药物在不同的医院信息系统中可能以商品名或通用名的形式出现这给药品数据的整合和管理带来了困难。 
数据格式不一致也给数据的一致性带来了挑战。在日期格式上有的平台采用 “YYYY - MM - DD” 的格式有的则采用 “MM/DD/YYYY” 或其他格式。在数值表示上不同平台对小数的精度和表示方式也可能存在差异。在医疗费用的记录中有的平台可能精确到分以两位小数表示而有的平台可能只精确到元以整数表示。这些格式上的差异需要在数据抽取和转换过程中进行统一和规范否则会影响数据的比较和分析。 
三、Informatica 在多医疗平台数据抽取中的详细操作 
3.1 创建数据源定义 
3.1.1 连接医疗数据源 
打开 Informatica 客户端的 PowerCenter Designer 工具进入数据源配置界面。在创建连接到 SQL Server 数据库的源定义时选择 “Relational” 源类型这是因为 SQL Server 属于关系型数据库这种类型能够准确适配其数据结构和查询方式。在连接属性配置中详细填写数据库名该名称需与 HIS 系统中实际使用的 SQL Server 数据库名称完全一致确保能够准确找到目标数据库。用户名和密码是访问数据库的关键凭证必须使用具有相应权限的数据库用户信息这些信息由数据库管理员根据数据抽取的需求进行分配和授权。例如若医院专门为数据抽取工作创建了一个名为 “etl_user” 的用户并赋予其对相关数据表的读取权限那么在此处就应填写该用户名及其对应的密码。服务器地址需准确填写 HIS 系统中 SQL Server 数据库所在服务器的 IP 地址或域名端口号则填写 SQL Server 默认的端口号 1433若在安装过程中对端口号进行了自定义修改则需填写修改后的端口号。 
完成上述信息的填写后点击 “测试连接” 按钮Informatica 会尝试与 SQL Server 数据库建立连接。若连接成功将弹出提示框告知用户连接正常此时可进行下一步操作若连接失败需仔细检查填写的各项信息是否准确无误如服务器地址是否可达、端口号是否被防火墙阻止、用户名和密码是否正确等。还需检查网络连接是否稳定确保能够正常访问数据库服务器。在某些情况下可能需要与网络管理员或数据库管理员协作共同排查连接失败的原因如检查服务器的网络配置、数据库的安全策略等。 
3.1.2 导入数据源表结构 
在成功建立连接后打开 Source Analyzer这是 Informatica 中用于管理和分析数据源的重要工具。在 Source Analyzer 中右键点击 “Sources”在弹出的菜单中选择 “Create Source Definition”开始创建数据源定义。此时需选择之前配置好的 SQL Server 数据源连接确保能够从正确的数据源中获取数据。 
在导入表结构时可根据实际需求选择要导入的表。以 HIS 系统为例患者信息表是记录患者基本情况的重要数据表包含患者的姓名、性别、年龄、身份证号、联系方式等信息这些信息对于后续的医疗数据分析、患者管理等工作具有重要意义。诊疗记录表则详细记录了患者的就诊过程包括就诊时间、科室、医生、诊断结果、治疗方案等信息是了解患者诊疗情况的关键数据来源。通过勾选这些表点击 “确定” 按钮Informatica 会自动将所选表的结构导入到项目中。在导入过程中Informatica 会识别表中的字段名称、数据类型、主键、外键等信息并将其准确地映射到项目中的数据源定义中。对于患者信息表中的 “患者姓名” 字段Informatica 会识别其数据类型为字符串型并将其准确地导入到数据源定义中相应的位置。这样在后续的数据抽取和处理过程中就能够基于这些准确的表结构信息进行操作。 
3.2 创建目标定义 
3.2.1 连接目标数据库 
在创建目标数据仓库的目标定义时同样需要在 Informatica 客户端中打开 PowerCenter Designer。在其中找到并打开 Target Designer这是专门用于定义目标数据存储相关设置的工具。在此处右键点击 “Targets”在弹出的快捷菜单中选择 “Create Target Definition”正式开始创建目标定义的流程。 
在选择目标数据库类型时需要根据实际情况进行精准选择。若目标数据仓库基于 MySQL 数据库构建那么就选择 MySQL 类型若使用的是 Oracle 数据库作为目标存储则选择 Oracle 类型。这一步的选择至关重要它决定了后续连接配置的方式和参数设置。以 MySQL 数据库为例在选择 MySQL 类型后需要详细配置连接信息。填写目标 MySQL 数据库的服务器地址这是指向数据库所在服务器的网络标识确保其准确性才能建立有效的连接。端口号通常为 MySQL 的默认端口 3306若在安装和配置 MySQL 时对端口进行了自定义修改则需填写修改后的端口号。数据库名称要与目标 MySQL 数据库中用于存储医疗数据的具体数据库名称完全一致用户名和密码则是具有向该数据库写入数据权限的用户凭证这些信息由数据库管理员根据数据抽取的需求进行合理分配和严格管理。 
完成上述信息的填写后同样需要点击 “测试连接” 按钮。Informatica 会依据填写的信息尝试与目标数据库建立连接。若连接成功系统会弹出提示框告知用户连接正常此时可放心进行下一步操作若连接失败需要仔细检查填写的各项信息是否准确无误如服务器地址是否正确、端口号是否被防火墙阻止、用户名和密码是否匹配等。还需检查网络连接是否稳定确保能够正常访问目标数据库服务器。在排查问题时可能需要与网络管理员或数据库管理员紧密协作共同分析和解决连接失败的原因例如检查服务器的网络配置、数据库的安全策略等以确保能够顺利建立与目标数据库的连接。 
3.2.2 导入目标表结构 
在成功连接到目标数据库后需要导入目标数据仓库中的维度表和事实表结构。在医疗数据仓库中患者维度表是非常重要的维度表之一它存储了患者的详细信息包括患者 ID、姓名、性别、年龄、地址、联系方式、出生日期、民族、婚姻状况等。这些信息对于从患者个体维度进行医疗数据分析具有重要意义例如通过分析不同年龄段患者的疾病分布情况可以为医院制定针对性的预防和治疗策略提供依据。疾病维度表则记录了各种疾病的相关信息如疾病编码、疾病名称、疾病分类、症状表现、治疗方法等。通过疾病维度表可以对疾病的诊断、治疗和研究进行深入分析。 
住院事实表是关键的事实表它记录了患者住院期间的核心信息如住院 ID、患者 ID、入院时间、出院时间、住院科室、主治医生、诊断结果、治疗费用、护理记录等。这些信息全面反映了患者的住院过程是进行医疗运营分析、费用管理和质量评估的重要数据来源。药品使用事实表则记录了患者在住院期间的药品使用情况包括药品 ID、患者 ID、用药时间、药品名称、剂量、用法、生产厂家等信息对于分析药品的使用效果、药物不良反应以及药品采购管理等方面具有重要作用。 
在导入表结构时在 Target Designer 中选择之前配置好的目标数据库连接确保能够从正确的目标数据源中获取表结构信息。然后勾选需要导入的患者维度表、疾病维度表、住院事实表、药品使用事实表等点击 “确定” 按钮。Informatica 会自动将所选表的结构导入到项目中包括表中的字段名称、数据类型、主键、外键等详细信息。对于患者维度表中的 “患者 ID” 字段Informatica 会识别其数据类型为整数型并将其准确地导入到目标定义中相应的位置同时明确该字段为主键用于唯一标识每个患者。通过这样的导入操作为后续将抽取和转换后的数据准确加载到目标表中奠定了坚实的基础。 
3.3 创建映射 
3.3.1 添加源与目标 
在 Informatica 的操作流程中创建映射是实现数据抽取、转换和加载的核心环节。打开 Mapping Designer这是专门用于设计映射关系的工具界面。在该界面中从 Sources 区域找到之前导入的 HIS 数据源表例如患者信息表 “PatientInfo”通过鼠标拖拽的方式将其放置到映射工作区中。这个操作的目的是明确数据的来源为后续的数据处理提供原始数据基础。同样从 Targets 区域找到对应的目标表如患者维度表 “PatientDim”也拖拽至映射工作区。通过这样的操作建立起了从数据源表到目标表的初步连接框架为后续的数据流动和处理搭建了桥梁。 
在实际操作中可能会遇到一些问题。例如在拖拽过程中可能由于网络延迟或软件响应问题导致表无法成功拖拽到指定区域。此时需要检查网络连接是否稳定或者尝试重新启动 Informatica 客户端以确保操作的顺利进行。另外在选择数据源表和目标表时一定要仔细核对表的名称和结构确保选择的准确性。若选择错误的表可能会导致后续的数据处理出现错误无法得到预期的结果。 
3.3.2 配置转换组件 
在数据抽取过程中表达式转换组件具有重要作用。通过该组件可以对数据进行灵活的计算和转换。在医疗数据处理中为了得到患者的年龄信息可在表达式中编写如下逻辑“age  TO_DATE (SYSDATE) - DOB”。这里“TO_DATE (SYSDATE)” 表示将当前系统日期转换为日期类型“DOB” 为患者的出生日期字段通过两者相减即可得到患者的年龄。为了得到患者的全名方便后续的数据分析和管理可使用表达式 “fullName  FirstName ||   || LastName”该表达式将患者的名字 “FirstName” 和姓氏 “LastName” 通过空格连接起来形成完整的姓名。 
在某些情况下可能需要对患者的年龄进行进一步的计算和判断。如果要筛选出年龄大于 60 岁的患者可在表达式中添加条件判断“IF (age 60,  老年患者 ,  其他患者 )”这样就可以根据患者的年龄进行分类为后续的医疗服务和数据分析提供更有针对性的信息。 
过滤转换组件在数据抽取中也不可或缺。在处理住院记录时可能需要过滤出特定日期后的记录以满足特定的业务需求。例如要过滤出 2024 年以后的住院记录可在过滤条件中设置为 “AdmissionDate TO_DATE (2024-01-01, YYYY - MM - DD)”。这一条件表示筛选出住院日期大于或等于 2024 年 1 月 1 日的记录。通过这样的过滤操作可以有效地减少数据量提高数据处理的效率同时确保处理的数据是符合特定时间范围要求的。 
在实际应用中可能会遇到日期格式不一致的问题。如果数据源中的日期格式为 “MM/DD/YYYY”而目标格式为 “YYYY - MM - DD”则需要在进行过滤操作之前先使用表达式转换组件将日期格式进行转换以确保过滤条件的准确性。例如可使用表达式 “TO_DATE (AdmissionDate, MM/DD/YYYY)” 将日期格式转换为目标格式然后再进行过滤操作。 
聚合转换组件能够对数据进行汇总统计。在医疗数据处理中若要统计每个科室的患者数量可将住院记录中的科室字段和患者 ID 字段连接到聚合转换组件中设置聚合函数为 “COUNT (PatientID)”这样就可以按科室对患者数量进行统计。若要计算每个科室的平均医疗费用可将医疗费用字段连接到聚合转换组件设置聚合函数为 “AVG (BillingAmount)”从而得到每个科室的平均医疗费用。这些统计信息对于医院的资源分配、成本控制等方面具有重要的参考价值。 
在使用聚合转换组件时可能会遇到数据类型不匹配的问题。如果医疗费用字段的数据类型为字符串型而聚合函数要求的数据类型为数值型那么在进行聚合操作之前需要先使用表达式转换组件将数据类型进行转换。例如可使用表达式 “TO_NUMBER (BillingAmount)” 将字符串型的医疗费用数据转换为数值型以便进行准确的聚合计算。 
3.4 ETL 过程详细编程实现 
3.4.1 数据抽取代码编写 
以抽取患者信息为例编写 SQL 查询语句抽取数据的过程如下在 SQL 查询语句中明确指定从患者信息表中抽取所需字段。假设患者信息表名为 “PatientInfo”要抽取患者的 ID、姓名、性别、出生日期、入院日期和出院日期等信息查询语句如下 
SELECTPatientID,FirstName,LastName,Gender,DOB,AdmissionDate,DischargeDateFROMPatientInfoWHEREAdmissionDate  2024-01-01; 在上述语句中“SELECT” 关键字用于指定要查询的字段这里列出了 “PatientID”患者 ID、“FirstName”名字、“LastName”姓氏、“Gender”性别、“DOB”出生日期、“AdmissionDate”入院日期和 “DischargeDate”出院日期。“FROM” 关键字指定了数据来源的表即 “PatientInfo” 表。“WHERE” 子句用于设置筛选条件这里筛选出 “AdmissionDate”入院日期大于或等于 “2024-01-01” 的记录确保抽取的数据是符合特定时间范围要求的。 
在实际应用中可能需要根据具体的业务需求调整查询条件。如果要抽取特定科室的患者信息可在 “WHERE” 子句中添加科室相关的条件如 “Department  Cardiology”假设科室字段名为 “Department”值为 “Cardiology” 表示心内科。若要抽取年龄在一定范围内的患者信息可结合日期函数计算患者年龄并在 “WHERE” 子句中添加年龄条件如 “WHERE (TO_DATE (SYSDATE) - DOB) BETWEEN 30 AND 50”假设 “SYSDATE” 为当前系统日期通过计算当前日期与出生日期的差值得到患者年龄并筛选出年龄在 30 到 50 岁之间的患者。 
3.4.2 数据转换逻辑实现 
在数据转换过程中通过表达式计算患者年龄的逻辑如下在 Informatica 的表达式转换组件中使用 “age  TO_DATE (SYSDATE) - DOB” 来计算患者年龄。这里“TO_DATE (SYSDATE)” 将当前系统日期转换为日期类型“DOB” 为患者的出生日期字段两者相减得到患者的年龄。假设 “SYSDATE” 返回的当前日期为 “2024-05-15”某患者的 “DOB” 为 “1980-03-20”则通过该表达式计算出的年龄为从 “1980-03-20” 到 “2024-05-15” 的时间差即 44 岁以年为单位。 
在格式化日期方面假设数据源中的入院日期 “AdmissionDate” 格式为 “MM/DD/YYYY”而目标格式要求为 “YYYY - MM - DD”。在表达式转换组件中可使用如下表达式进行转换“formattedAdmissionDate  TO_CHAR (TO_DATE (AdmissionDate, MM/DD/YYYY), YYYY - MM - DD)”。这里“TO_DATE (AdmissionDate, MM/DD/YYYY)” 将原始格式的日期字符串转换为日期类型然后 “TO_CHAR (...)” 将日期类型转换为目标格式的字符串。若原始的 “AdmissionDate” 为 “05/15/2024”经过该表达式转换后“formattedAdmissionDate” 将变为 “2024 - 05 - 15”。 
在实际应用中可能会遇到日期格式不规范或存在错误的情况。若数据源中的日期字符串包含非数字字符如 “05-15/2024”在进行上述转换之前需要先对日期字符串进行清理和纠正。可以使用正则表达式等方法去除非数字字符然后再进行日期格式的转换。若遇到无法解析的日期值可能需要进行特殊处理如将其设置为默认值或记录错误日志以便后续进行排查和处理。 
3.4.3 数据加载设置 
将转换后的数据加载到目标表的设置方法如下在 Informatica 中首先要确保目标表已经创建且结构与转换后的数据相匹配。以患者维度表 “PatientDim” 为例假设其表结构如下 
CREATE TABLE PatientDim (PatientID INT PRIMARY KEY,FullName VARCHAR(100),Gender CHAR(1),DOB DATE,Age INT,AdmissionCount INT); 在上述表结构中“PatientID” 字段作为主键用于唯一标识每个患者。“FullName” 字段用于存储患者的全名数据类型为可变长度字符串最大长度为 100 个字符。“Gender” 字段存储患者性别数据类型为字符型长度为 1。“DOB” 字段存储患者的出生日期数据类型为日期型。“Age” 字段存储患者的年龄数据类型为整型。“AdmissionCount” 字段用于记录患者的入院次数数据类型为整型。 
在加载数据时要配置目标定义将转换后的数据字段与目标表的字段进行准确映射。在映射设计中将患者信息表中计算得到的 “FullName” 字段映射到 “PatientDim” 表的 “FullName” 字段将 “Gender” 字段映射到 “PatientDim” 表的 “Gender” 字段将 “DOB” 字段映射到 “PatientDim” 表的 “DOB” 字段将计算得到的 “Age” 字段映射到 “PatientDim” 表的 “Age” 字段。对于 “AdmissionCount” 字段若在数据抽取和转换过程中已经计算出每个患者的入院次数则将相应的计算结果字段映射到该字段若尚未计算则可在后续的转换或加载过程中添加计算逻辑确保数据的完整性和准确性。 
在设置加载策略时可根据业务需求选择合适的策略。若目标表中不允许重复记录且数据具有唯一性标识如 “PatientID”可选择 “插入 / 更新” 策略。在这种策略下当加载数据时若目标表中不存在与源数据中 “PatientID” 相同的记录则将源数据插入到目标表中若存在相同的 “PatientID” 记录则更新目标表中相应的字段值如更新患者的年龄、入院次数等信息。若目标表仅用于追加新数据不考虑数据的重复问题可选择 “追加” 策略将源数据直接追加到目标表的末尾适用于一些日志记录或历史数据积累的场景。 四、案例分析与实践验证 
4.1 案例选取与介绍 
选取某大型综合医院作为案例研究对象。该医院拥有多个医疗平台包括先进的医院信息系统HIS、全面的电子病历系统EMR以及专业的实验室信息管理系统LIS等。然而随着医院业务的不断拓展和数据量的持续增长不同医疗平台之间的数据孤立问题日益凸显。各平台的数据格式、编码体系和存储方式存在较大差异导致数据难以共享和综合利用。在临床决策方面医生需要在多个系统中切换查询患者的相关信息耗费大量时间和精力且容易出现信息遗漏影响诊断和治疗的准确性。在医院管理决策上由于无法及时获取全面、准确的运营数据管理层难以做出科学合理的资源配置和战略规划。为了打破数据壁垒实现数据的高效整合与分析该医院决定采用 Informatica 进行多医疗平台的数据抽取和整合工作。 
4.2 利用 Informatica 进行数据抽取的实施过程 
4.2.1 需求分析与方案设计 
针对该医院的实际需求进行了全面且深入的分析。在临床决策支持方面医生急需能够快速获取患者完整且准确的诊疗信息包括过往病史、近期的检查检验结果以及实时的生命体征数据等。过往病史能帮助医生了解患者的疾病发展轨迹判断当前病情是否与既往疾病存在关联近期的检查检验结果如血液检查、影像学检查等能为医生提供直观的病情证据辅助诊断疾病的类型和严重程度实时的生命体征数据则能及时反映患者的病情变化使医生能够迅速做出治疗决策。在医院管理决策方面管理者需要掌握详细的运营数据如患者流量的变化趋势、医疗资源的使用效率以及财务收支的具体情况等。通过分析患者流量的变化趋势管理者可以合理安排医护人员的排班优化医疗资源的配置了解医疗资源的使用效率有助于管理者及时调整设备采购计划和药品库存管理策略掌握财务收支情况则能为医院的成本控制和战略规划提供重要依据。 
基于这些需求制定了相应的数据抽取方案。在数据源方面确定从医院信息系统HIS中抽取患者的基本信息、诊疗记录、费用明细等数据从电子病历系统EMR中获取患者的病历详情、诊断结果、治疗方案等信息从实验室信息管理系统LIS中抽取检验检查结果数据。在数据抽取方式上对于患者的基本信息等相对稳定的数据采用全量抽取的方式确保数据的完整性对于诊疗记录、检验检查结果等实时更新的数据采用增量抽取的方式以提高数据抽取的效率减少数据传输量和处理时间。在数据抽取频率上根据不同数据的重要性和时效性进行了合理设置。对于患者的实时生命体征数据抽取频率设置为每分钟一次确保医生能够及时掌握患者的最新病情对于诊疗记录和检验检查结果抽取频率设置为每小时一次既能保证数据的及时性又不会对系统性能造成过大压力。 
4.2.2 遇到的问题与解决方法 
在实施过程中遇到了诸多问题。数据类型不匹配是较为常见的问题之一。例如在将数据源中的数据抽取到目标表时发现某个字段在数据源中的数据类型为 VARCHAR而在目标表中定义的数据类型为 INT这就导致数据无法正确加载。为了解决这个问题通过仔细检查数据源和目标表的字段定义利用 Informatica 的表达式转换组件将数据源中的数据类型进行转换使其与目标表中的数据类型一致。在表达式转换组件中使用合适的函数将 VARCHAR 类型的数据转换为 INT 类型确保数据能够顺利加载到目标表中。 
性能问题也是一个关键挑战。随着数据量的不断增加数据抽取和转换的速度逐渐变慢严重影响了系统的运行效率。为了解决性能问题对源表和目标表进行了索引优化。在源表中针对经常用于查询和过滤的字段创建索引这样在数据抽取时能够快速定位到所需的数据减少数据扫描的时间。在目标表中同样为关键字段创建索引提高数据加载的速度。合理调整了 Informatica 的参数设置如增加并行处理的线程数充分利用服务器的多核 CPU 资源将数据处理任务分解为多个子任务并行执行从而提高数据处理的速度。对数据抽取和转换的逻辑进行了优化减少不必要的计算和操作进一步提高系统的性能。 
在数据抽取过程中还可能遇到数据源连接不稳定的问题。由于网络波动或数据源服务器的故障可能导致连接中断影响数据抽取的连续性。为了解决这个问题采用了重试机制。在 Informatica 中设置连接重试的次数和间隔时间当连接失败时系统会自动尝试重新连接直到达到重试次数上限或连接成功为止。还加强了对数据源服务器的监控及时发现并解决服务器故障确保数据源的稳定性。通过这些措施有效地解决了实施过程中遇到的各种问题保证了数据抽取工作的顺利进行。 
4.3 数据抽取结果验证与分析 
4.3.1 数据质量评估 
为了全面评估抽取结果的数据质量采用了多种方法对数据准确性进行检查。通过编写 SQL 查询语句对抽取到的数据进行精确校验。在患者信息表中使用如下查询语句检查身份证号的准确性 
SELECT * FROM PatientInfoWHERE LENGTH(IdentityCard)! 18 OR NOT REGEXP_LIKE(IdentityCard, ^[0-9]{17}[0-9Xx]$); 该语句用于筛选出身份证号长度不为 18 位或者不符合身份证号正则表达式格式的数据记录。通过执行此查询能够快速定位到身份证号存在错误的数据行从而进行进一步的核实和修正。 
对于诊疗记录中的诊断结果与权威的医学诊断标准库进行比对。将抽取到的诊断结果数据与国际疾病分类标准库ICD - 10进行逐一匹配检查是否存在诊断结果不规范或错误的情况。对于某些模糊或不确定的诊断结果组织医学专家进行人工审核确保诊断结果的准确性和可靠性。 
在数据完整性检查方面对各表的关键字段进行全面的空值检查。使用以下 SQL 查询语句检查患者信息表中姓名、性别、年龄等关键字段是否存在空值 
SELECT * FROM PatientInfoWHERE Name IS NULL OR Gender IS NULL OR Age IS NULL; 通过执行该查询能够快速找出关键字段存在空值的数据记录以便及时进行数据补充或修正。对于诊疗记录中的检查检验结果检查是否存在缺失的情况。根据检查检验项目的逻辑关系和业务规则判断是否所有必要的检查检验结果都已完整抽取。如果发现某些检查检验结果缺失需要进一步追溯数据源查找缺失原因并采取相应的措施进行数据补充。 
为确保数据一致性统一了不同医疗平台中相同数据的编码和格式。在疾病诊断编码方面将所有的疾病诊断编码统一转换为国际疾病分类编码ICD - 10。通过编写数据转换逻辑将医院内部自定义的疾病编码或其他不规范的编码转换为标准的 ICD - 10 编码确保疾病诊断数据的一致性和可比性。在日期格式方面将所有涉及日期的数据统一转换为 “YYYY - MM - DD” 的标准格式。使用日期转换函数对不同格式的日期数据进行规范化处理避免因日期格式不一致而导致的数据处理错误。 4.3.2 性能测试与分析 
在数据抽取时间测试方面使用专业的性能测试工具如 LoadRunner对不同数据量下的数据抽取时间进行了精确测量。在测试过程中模拟了多种实际场景包括从少量数据如 1000 条记录到大量数据如 100 万条记录的抽取情况。通过多次重复测试记录每次抽取的时间并计算平均值和标准差以确保测试结果的准确性和可靠性。 
在测试过程中发现随着数据量的增加数据抽取时间呈现出非线性增长的趋势。当数据量较小时数据抽取时间相对较短且增长较为平缓。但当数据量超过一定阈值如 50 万条记录时数据抽取时间增长迅速。这是因为随着数据量的增大数据传输、处理和存储的压力也随之增大导致数据抽取时间显著增加。通过对测试数据的分析绘制了数据抽取时间与数据量的关系曲线直观地展示了数据抽取时间随数据量变化的趋势。 
在资源消耗测试方面使用系统监控工具如 Windows 系统自带的任务管理器和 Linux 系统的 top 命令对服务器的 CPU、内存和磁盘 I/O 等资源消耗情况进行了实时监测。在数据抽取过程中密切关注这些资源的使用情况记录资源使用率随时间的变化曲线。 
测试结果表明在数据抽取过程中CPU 使用率随着数据量的增加而逐渐升高。当数据量较大时CPU 可能会出现长时间高负荷运行的情况这可能会影响服务器的其他业务。内存消耗也会随着数据量的增加而显著上升尤其是在数据转换和加载过程中需要占用大量的内存来存储临时数据。磁盘 I/O 方面在数据抽取和加载过程中会频繁进行磁盘读写操作导致磁盘 I/O 繁忙。为了优化性能采取了一系列措施。对源表和目标表进行了索引优化针对经常用于查询和过滤的字段创建索引以减少数据扫描的时间。合理调整了 Informatica 的参数设置如增加并行处理的线程数充分利用服务器的多核 CPU 资源提高数据处理速度。对数据抽取和转换的逻辑进行了优化减少不必要的计算和操作进一步降低资源消耗。 
4.3.3 对医院业务的实际帮助 
在临床决策方面抽取的数据为医生提供了全面且准确的患者信息。通过整合多个医疗平台的数据医生能够在一个系统中获取患者的完整病历包括既往病史、检查检验结果、治疗记录等。这使得医生能够更全面地了解患者的病情从而做出更准确的诊断和治疗决策。在面对一位患有复杂疾病的患者时医生可以通过查看整合后的病历快速了解患者的既往疾病诊断、治疗过程以及过敏史等信息结合当前的检查检验结果制定出更具针对性的治疗方案。研究表明使用整合后的医疗数据进行临床决策医生的诊断准确率提高了约 20%治疗效果也得到了显著改善。 
在医院管理方面抽取的数据为管理者提供了丰富的运营信息。通过分析患者流量数据管理者可以合理安排医疗资源优化医护人员的排班提高医疗服务的效率。根据不同时间段、不同科室的患者流量情况提前调配医护人员确保患者能够得到及时的救治。通过对医疗资源使用情况的分析管理者可以优化资源配置降低医疗成本。合理调整医疗设备的采购计划避免设备闲置浪费优化药品库存管理减少药品积压和过期损失。通过对财务数据的分析管理者可以制定合理的收费标准提高医院的经济效益。通过数据分析医院的运营成本降低了约 15%医疗服务质量得到了显著提升。 
 文章转载自: http://www.morning.kehejia.com.gov.cn.kehejia.com http://www.morning.ljtwp.cn.gov.cn.ljtwp.cn http://www.morning.pjrql.cn.gov.cn.pjrql.cn http://www.morning.ttdbr.cn.gov.cn.ttdbr.cn http://www.morning.kklwz.cn.gov.cn.kklwz.cn http://www.morning.qgkcs.cn.gov.cn.qgkcs.cn http://www.morning.ylph.cn.gov.cn.ylph.cn http://www.morning.blfll.cn.gov.cn.blfll.cn http://www.morning.fcwb.cn.gov.cn.fcwb.cn http://www.morning.khzml.cn.gov.cn.khzml.cn http://www.morning.gychx.cn.gov.cn.gychx.cn http://www.morning.krdmn.cn.gov.cn.krdmn.cn http://www.morning.errnull.com.gov.cn.errnull.com http://www.morning.shawls.com.cn.gov.cn.shawls.com.cn http://www.morning.smrty.cn.gov.cn.smrty.cn http://www.morning.rqhn.cn.gov.cn.rqhn.cn http://www.morning.qmkyp.cn.gov.cn.qmkyp.cn http://www.morning.litao7.cn.gov.cn.litao7.cn http://www.morning.gbrps.cn.gov.cn.gbrps.cn http://www.morning.zsleyuan.cn.gov.cn.zsleyuan.cn http://www.morning.kwdfn.cn.gov.cn.kwdfn.cn http://www.morning.nlbw.cn.gov.cn.nlbw.cn http://www.morning.lndongguan.com.gov.cn.lndongguan.com http://www.morning.rwqj.cn.gov.cn.rwqj.cn http://www.morning.txqsm.cn.gov.cn.txqsm.cn http://www.morning.pfcrq.cn.gov.cn.pfcrq.cn http://www.morning.bnbzd.cn.gov.cn.bnbzd.cn http://www.morning.cpmwg.cn.gov.cn.cpmwg.cn http://www.morning.nqmdc.cn.gov.cn.nqmdc.cn http://www.morning.cwjsz.cn.gov.cn.cwjsz.cn http://www.morning.vuref.cn.gov.cn.vuref.cn http://www.morning.rwyd.cn.gov.cn.rwyd.cn http://www.morning.frmmp.cn.gov.cn.frmmp.cn http://www.morning.tongweishi.cn.gov.cn.tongweishi.cn http://www.morning.hcrxn.cn.gov.cn.hcrxn.cn http://www.morning.mbpzw.cn.gov.cn.mbpzw.cn http://www.morning.mydgr.cn.gov.cn.mydgr.cn http://www.morning.yjfzk.cn.gov.cn.yjfzk.cn http://www.morning.sjwiki.com.gov.cn.sjwiki.com http://www.morning.nfmlt.cn.gov.cn.nfmlt.cn http://www.morning.qnksk.cn.gov.cn.qnksk.cn http://www.morning.bgpch.cn.gov.cn.bgpch.cn http://www.morning.zmbzl.cn.gov.cn.zmbzl.cn http://www.morning.blqsr.cn.gov.cn.blqsr.cn http://www.morning.cpmfp.cn.gov.cn.cpmfp.cn http://www.morning.qpsdq.cn.gov.cn.qpsdq.cn http://www.morning.ykrkq.cn.gov.cn.ykrkq.cn http://www.morning.tnzwm.cn.gov.cn.tnzwm.cn http://www.morning.kscwt.cn.gov.cn.kscwt.cn http://www.morning.hyhzt.cn.gov.cn.hyhzt.cn http://www.morning.dnycx.cn.gov.cn.dnycx.cn http://www.morning.yltyz.cn.gov.cn.yltyz.cn http://www.morning.qyllw.cn.gov.cn.qyllw.cn http://www.morning.wwjft.cn.gov.cn.wwjft.cn http://www.morning.fdzzh.cn.gov.cn.fdzzh.cn http://www.morning.wgtnz.cn.gov.cn.wgtnz.cn http://www.morning.sgfpn.cn.gov.cn.sgfpn.cn http://www.morning.hpnhl.cn.gov.cn.hpnhl.cn http://www.morning.gjwkl.cn.gov.cn.gjwkl.cn http://www.morning.skcmt.cn.gov.cn.skcmt.cn http://www.morning.zdydj.cn.gov.cn.zdydj.cn http://www.morning.nqcts.cn.gov.cn.nqcts.cn http://www.morning.wlfxn.cn.gov.cn.wlfxn.cn http://www.morning.rdmn.cn.gov.cn.rdmn.cn http://www.morning.yxgqr.cn.gov.cn.yxgqr.cn http://www.morning.zgnng.cn.gov.cn.zgnng.cn http://www.morning.wlnr.cn.gov.cn.wlnr.cn http://www.morning.jqbpn.cn.gov.cn.jqbpn.cn http://www.morning.zgztn.cn.gov.cn.zgztn.cn http://www.morning.shxrn.cn.gov.cn.shxrn.cn http://www.morning.mzhhr.cn.gov.cn.mzhhr.cn http://www.morning.tqjks.cn.gov.cn.tqjks.cn http://www.morning.hkgcx.cn.gov.cn.hkgcx.cn http://www.morning.qgkcs.cn.gov.cn.qgkcs.cn http://www.morning.qkkmd.cn.gov.cn.qkkmd.cn http://www.morning.lhhdy.cn.gov.cn.lhhdy.cn http://www.morning.rtmqy.cn.gov.cn.rtmqy.cn http://www.morning.rfpb.cn.gov.cn.rfpb.cn http://www.morning.qzfjl.cn.gov.cn.qzfjl.cn http://www.morning.lktjj.cn.gov.cn.lktjj.cn