当前视点!数据剖析更灵活、更快捷,火山引擎DataLeap动态探查全面升级
近期,火山引擎DataLeap上线“动态探查”能力,为用户提供全局数据视角、完善的抽样策略,提高数据探查的灵活度以及响应速率。
(资料图)
传统的数据探查是基于库表的全量探查,由后端引擎执行,通过自动化检查数据成分、关系、格式等,以报告形式展示探查后列的统计分布结果,避免数据质量导致项目开发、上线出现问题,主要应用于元数据管理、数据研发、数仓开发以及数据治理等环节,满足使用者对数据质量初探的需求。
但在数据量级大、用户需要探查数据明细或需要数据预处理操作时,由于传统的数据探查要对全量表进行检测,导致无法实时产出报告、等待时间变长,灵活度低,且无法跟踪数据明细。
针对上述痛点,火山引擎DataLeap在传统数据探查基础能力上,进一步增强了动态探查能力。其特点在于:
● 基于大数据预览探查,支持对数据进行函数级别预处理。
● 数据探查结果秒级更新、实时响应。
● 与数据监控联动,有效打通数据探查到质量分析闭环。
据介绍,DataLeap动态探查的对象是抽样数据,支持连续抽样(按照默认顺序连续抽样前x条数据)、过滤抽样(使用where过滤语句过滤)、随机抽样(随机抽样x条数据)3种模式,用户可对数据进行预处理,实时、动态获得统计分布结果,具备灵活度高、实效性强的特点。
火山引擎DataLeap数据探查报告
目前,DataLeap动态探查可以应用在以下三个场景中:
● 场景1:用于分析型探查场景,用户可利用hive基本函数,如get_json_object,将列进行数据提取。
● 场景2:与探查报告打通,用户点击探查报告中的统计值,即可跳转到数据表格,并应用具体行过滤函数。
● 场景3:用于数据过滤后的探查场景,用户通过过滤和分组条件进行写条件探查,例如校验status=0时current_price为0的占比。
DataLeap是火山引擎数智平台旗下产品,提供数据集成、开发、运维、治理、资产、安全等能力,帮助用户提升数据研发效率、降低管理成本,加速推动企业的数字化转型,目前已经应用于泛互联网、制造、新零售、汽车等领域。(作者:姚元宇)
相关新闻
- 当前视点!数据剖析更灵活、更快捷,火山引擎DataLeap动态探查全面升级
- 苏州高新区狮山横塘街道:守护“一老一小” 绘就幸福底色
- 大金重工:子公司签订约1.96亿欧元海风项目供货合同
- 环球视点!大宗交易:克莱特成交648.79万元,折价8.16%(05-10)
- 沪深两市今日成交额合计10200亿元 昆仑万维成交额居首-今日视点
- 西安航空口岸完成首单植物种苗进口业务 全球关注
- 黄金前景如何,分析师观点各异! 世界新要闻
- 额头长小疙瘩_额头上起小疙瘩的原因
- 孔子弟子简介资料大全_孔子简介资料大全
- 稳中有进,亮点纷呈!龙港新城交出高质量“硬核”答卷
- 战场女武神4二周目玩什么_战场女武神4后期刷钱技巧攻略简介介绍
- 信用卡2个月逾期会黑名单吗?多张信用卡欠20万还不上怎么办?-环球热资讯
- 全球热文:完美世界:5月9日融券卖出金额1328.74万元,占当日流出金额的1.38%
- 【世界独家】九江武宁县进一步赋能生态产品价值转化工作
- 英维克:5月9日融资买入2040.05万元,融资融券余额1.86亿元 环球观速讯
- 文水:筑牢禁毒防线 共建无毒胡兰
- 百姓身边的黑科技之“娱” | 超清成像带来的全新视觉盛宴
- 苹果手机通话记录怎么设置不删掉_苹果手机通话记录怎么设置-天天播资讯
- 通讯!《信访工作条例》实施一周年主题宣传暨全省第六个信访法治宣传月活动启动
- 抢钱俱乐部:黄金半夜闹鬼难长久,2047上中线闭眼空!_环球视讯