谁是更大的恶东谈主?数据债与本事债
开头:云云众生s
积极处理数据束缚不错减少本事债务并增强可彭胀性。
译自Who’s the Bigger Villain? Data Debt vs. Technical Debt,作家 Pascal Desmarets。
译自Who’s the Bigger Villain? Data Debt vs. Technical Debt,作家 Pascal Desmarets。
IT 行业的每个东谈主皆知谈本事债务。本事债务(也称为本事债、代码债务或假想债务)是一个比方,它姿色了开发团队优先委派功能或姿色可能带来的后果,这些功能或姿色以后需要重构或重作念。
本事债务可能是有益的,应该保留在开发东谈主员专门志地汲取长久不成执续但能带来短期利益的设战略略的情况下,举例发布版块。非有益的本事债务可能是由于“快速而弄脏”或“快速活动并突破老例”的法度形成的。
张开剩余81%Martin Fowler 的2009 年著述对于本事债务象限的著述姿色了第二个轴,对严慎的本事债务和璷黫的本事债务进行了关联的分辨。
数据债务是一种本事债务,它指的是由于厄运的数据束缚推行(举例不竣工、不准确或非尺度化数据)而累积的资本,这些资本会跟着时分的推移而拦阻恶果和决议。
数据债务不单是是空匮,它会导致数据不成靠和手动数据束缚。数据债务会裁减数据质地,放慢决议速率,增多资本,并挫伤对洞费力的信任,从而碎裂组织成为数据驱动型组织的能力。
尽管数据债务和本事债务密切关联,但两者之间存在枢纽区别:您不错布告本事债务歇业并从头运行,但对数据债务这么作念很少是可行的汲取。
璷黫和非有益的数据债务源于更低的存储资本和数据囤积文化,在这种文化中,组织麇集了多数数据,而莫得配置适合的结构或确保分享的荆棘文和含义。它进一步受到对假想优先法度的抵制的影响,这种法度通常被合计是速率的潜在瓶颈。它也可能通过数据湖、仓库和湖仓中脆弱的多跳奖章架构真切。
就像莫得假想就编写代码会导致本事债务同样,这种零落战略磋磨导致数据不一致、冗余和独处,使得集成、分析和价值提真金不怕火越来越复杂。
数据束缚中的左移
对于数据债务,防患胜于颐养。“左移”是一种推行,它波及在开发人命周期的早期科罚枢纽进程,以便在问题发展成更严重的问题之前识别和科罚这些问题。行使于数据束缚,“左移”强调尽早优先接头数据建模,若是可能的话——在汇集数据或构建系统之前。
数据建模允许投降假想优先的法度,其中数据结构、含义和干系在汇集之前经过三想此后行地磋磨和扣问。这种法度通过确保透露度、一致性和团队间的息争来减少数据债务,从而已矣更纵情的集成、分析和数据的长久价值。
通过在运行时使用数据建模,组织不错阐发业务需求界说数据的结构、含义和干系。这种主动策略通过注重创建不一致、冗余或难以贯串的数据来减少数据债务。它还确保本事团队和业务用户对数据有透露的贯串,从而提升数据质地,简化集成,并已矣长久可彭胀性。内容上,“左移”使团队好像“为将来假想”,而不是在问题发生后才开导问题。
代码优先法度的撑执者应该通晓到,当敏捷原则与限度驱动数据建模一齐行使时,数据建模不再是瓶颈。
然则,每个组织很可能依然存在一定进程的数据债务。有什么臆测打算来按捺它?
绘画现存数据
数据模子,就像舆图或蓝图同样,是数据组织姿色的可视化示意。通过搜检现存的数据库、数据源和数据交换,组织不错将实体、属性以及它们之间的连结绘画到实体干系图或更浅近的图表中。
这个逆向工程过程波及分析和绘画现存数据结构,以揭示其底层假想和干系。它有助于识别不一致之处、冗余和差距,从而更好地贯串和记载数据,以便在必要时革新集成、分析和从头假想。
通过绘画现存数据,该过程使界说、干系和结构明确化,弥合了IT和业务用户之间的差距。它使业务团队好像长入数据若何反馈运营和进程。同期,IT部门好像明晰地了解数据如安在决议、自助分析、机器学习和东谈主工智能中使用。这种分享的贯串促进了衔尾,减少了污蔑,并确保每个东谈主——从本事团队到业务利益关联者——皆能使用一致且专门想道理的数据。
元数据束缚器用和数据字典通常依赖于逆向工程和分析来汇集现存数据结构,揭示干系并记载属性。天然这些过程提供了对数据面前景色的贵重概念,但它们内容上是反应式的,侧重于编目现存内容,而不是主动假想数据结构。这种局限性意味着它们无法隔断数据债务的累积,因为它们无法从一运行就推行正确的假想原则或使数据与业务需求保执一致。
假想您将来的数据
数据建模通过启用假想优先的法度来补充这些器用,其中数据以分享的含义、荆棘文和将来的可彭胀性为臆测打算进行用心构建。
数据模子不是最终臆测打算。从本事方面来看,其主义包括配置与主题各人业务需求一致的步方单约,并由数据分娩者和破费者共同约定。从业务方面来看,它促进了对正在交换和存储的数据的含义和荆棘文的纵情分享和看望。
数据建模通过创建坚实的基础并促进现存结构的演变来注重新的数据债务。通过诱骗改动以相宜本事和业务需求,数据建模匡助组织为其数据创造更可执续和高效的将来,减少昔日造作的职守,同期确保执续的价值。
数据模子也行使于数据交换
数据建模传统上与用于事务或分析主义的干统统据库关联联。跟着时分的推移,这跟着NoSQL数据库、API、事件驱动架构和微行状的兴起而彭胀。
天然开发东谈主员率先关心底层本事,但很昭彰,到手数据交换的枢纽在于有用载荷的结构。数据发布者和破费者必须就以步地为中枢的数据公约达成一致,以便有用相通。此步地界说了交换的结构,无论是API如故Kafka事件。
论断
为了减少您的数据债务,请将您现存的数据绘画成一个透明、全面的数据模子,以映射您面前的数据结构。这不错迭代地进行,阐发需要科罚问题——幸免试图一次性科罚整个问题。
让限度各人和数据利益关联者参与专门想道理的扣问,以长入数据的荆棘文、道理道理和用途。
在此基础上,迭代地革新这些模子——无论是静态数据如故动态数据——以便它们准确地反馈并孤高您组织和客户的需求。
这么作念为数据一致性、透露度和可彭胀性奠定了坚实的基础,开释了数据的全部后劲,并促进了更周密的决议和将来的翻新。
本文在云云众生(https://yylives.cc/)首发,迎接各人看望。
本文在云云众生(https://yylives.cc/)首发,迎接各人看望。
发布于:北京市