【大河财立方记者王宁宁深圳报道】9月11日最专业股票配资平台,大河财立方记者从深圳数据交易所获悉,近日深译科技在深圳数据交易所指导下发布了全国首个高价值、多模态、多语种AI算料数据资产包,估值超过2亿元。
作为珠海市新质生产力及人工智能数据要素代表性企业,深译科技将充分发挥数据要素乘数效应,进一步推动人工智能技术生态的发展与建设,为珠海“云上智城”奠定AI产业数据要素基础。
推动全国首批大模型产品上市交易
自2023年ChatGPT 4.0版本正式发布以来,我国人工智能产业步入高速发展阶段,截至2023年底,中国人工智能核心产业的规模已接近6000亿元,如盘古、智谱AI、文心一言等通用型大模型与细分行业大模型商用化日益成熟。
据全国组织机构统一社会信用代码数据服务中心统计,2024年上半年我国人工智能企业数量同比增长35.65%,而AI赋能千行百业的核心基础正是语料数据的不断丰富与完善。
当前国内语料数据文本量仅占全球的1.3%,自2023年4月以来,深圳数据交易所加快推动国内外高质量语料数据汇集,先后联合深译科技、华为、华傲科技等语料与人工智能优质厂商构建“开放算料联盟”,发布涵盖12个“数据要素×”领域,包括文本、图像、音频、视频、多模态、3D、GIS等多种数据模态,由42家不同的数据商提供的1000个非开源、可商用的垂直行业多模态算料集,其中大部分算料为全国首发。
与此同时,深圳数据交易所创新推动了人工智能数据专区、开放群岛开源社区大模 SIG建设,率先实现首批国家备案大模型公司入场,推动全国首批大模型产品上市并完成场内数据商品交易。
体系化赋能“数据丝绸之路”高质量建设
作为深圳数据交易所人工智能语料领域的重点合作伙伴,深译科技董事长林余楚在活动中表示,公司依托澳门大学、澳门科技大学等澳门高校的科研力量和人才体系,不断创新打造了自研的数据引擎——深数引擎(Deep Data Engine),构建了闭环数据采标SOP、国际化众包平台、AI标注等生产流程和工具,并沉淀积累大量自有产权AI大模型全产业开发训练的多语言数据集。
作为深耕大语种专业领域及小语种语料数据的数据要素企业,深译科技已实现“一带一路”沿线产业整合,在葡语系、一带一路小语种领域,数据集数量和质量均处于行业第一梯队。同时,通过产业体系构建,深圳数据交易所与深译科技正在加快推动沿线“数据丝绸之路”建设。
为响应国家数据要素市场发展,构建稳定高效的数据要素产业链,深圳数据交易所持续聚集优质数据资产化第三方服务生态。
记者获悉,2024年7月,深圳数据交易所与深译科技携手法律合规机构、资产评估机构、数据质量评估机构等生态合作伙伴,共同围绕深译科技现有超40pb高质量语料数据开展由资源盘点与合规审核上市到数据资产入表的全流程合作,推动深译科技数据资源向数据要素到数据资产的体系化转化。
林余楚表示,在深圳数据交易所的主导下,历时近一年时间最专业股票配资平台,深译科技两个模态的数据资产包成功完成合规审查、上市入表等工作,并通过中评协评估估值2.04亿元。活动现场,深译科技还展示了公司的数据要素一张图及深译科技大模型平台Deepaas等产品。
文章为作者独立观点,不代表合法配资炒股观点