数据即服务:提供即时数据的顶级供应商
2022-04-18 16:31:57来源:企业网D1Net
并非所有可能使企业受益的数据都可以通过内部方式轻松生成、清理和分析。数据即服务提供商则是可以为企业提供数据即用型数据使用的实体。
那么谁需要数据即服务(DaaS)?任何企业都渴望获得有用的数据,并希望是值得信赖的、忠诚的、提供帮助的数据。有时,DaaS供应商提供的数据来自他们的内部运作或他们自己的业务运营。有时它来自外部资源(通常是开放的),由DaaS供应商收集,以帮助企业利用他们可能无法自行处理的数据资产。
DaaS产品已经发展了数十年,最近开发人员已经认识到,具有灵活、基于使用的定价的云模型,可以更容易地帮助将企业与供应商寻求盈利的数据源连接起来。这不仅仅是关于提供的数据本身。DaaS供应商还可以通过纠正错误或填补空白来提高企业可能自行收集的数据质量,甚至在企业需要更多数据时及时提供。通过这种方式,DaaS提供商可以通过与其他精心挑选的数据源进行交叉融合,来改进企业自己开发的数据仓库。
这一领域正在迅速增长。一些DaaS供应商强调其工具管理信息、分析数据、创建报告和支持决策制定的能力。其他公司则提高数据本身的质量,因为他们知道拥有太多数据并不一定是好事。每个人都在市场上寻找关于竞争对手、客户、内部运营以及整个世界的更多信息。
许多工具也遵循当前的开发工作变得更简单、更智能。低代码和无代码选项使任何人都可以更轻松地单击键盘并生成报告,或下载加载数据的电子表格,而无需与开发人员召开无休止的会议进行沟通。企业还强调它们与良好的人工智能算法和数据科学选项的联系。
以下许多选项可以满足企业的DaaS需求。
云计算提供商所有主要的云计算公司都为其客户维护大量开放数据集。在许多情况下,数据是免费的,并作为使用本地计算服务的激励措施提供。数据通常已经转换,有时会在转换为本地格式时进行改进,以便与企业的代码轻松集成。数据集包括许多政府部门收集的数据,例如天气数据和Azure开放数据集,包括人口普查数据和犯罪数据,以及一些专注于了解全球气候变化的数据集。AWS开放数据包括各种基因组数据和500亿个网页的Common Crawl。谷歌云的数据集包括专利、天气信息,以及谷歌公司通过跟踪搜索和网络分析产生的数据。
信贷机构Experian、TransUnion和Equifa这三大公司跟踪所有人如何借入和偿还贷款,以计算出旨在衡量人们在未来的可信度的分数。在过去,这些分数相当神秘和隐蔽,但最近银行和信用卡公司正在直接与客户分享分数,以鼓励更好的行为。
信贷机构本身并不满足于与贷方合作。例如,Equifax公司希望解决更大的问题,例如劳动力管理、欺诈、身份盗用和营销。了解人们的收入以及他们如何消费和偿还贷款可能有助于预测医疗保健、汽车、制造和零售等行业的各种问题。
现在,信用机构正在探索提供答案的新方法。例如,Equifax Ignite是一种基于云的工具,可让用户分析Equifax的数据,而不会将个人敏感信息泄露。它在多层安全性和合规性下进行复杂的分析。
Enigma跟踪世界上每一个小企业的成长和发展并不容易。Enigma从各种政府机构和开源收集信息,然后将信用卡和借记卡银行提供的匿名交易级详细信息混合在一起。人们了解现金流是了解企业性质的最快方法。
HIRinfotech可能想要的大部分信息通常已经在网站上提供。HIRinfotech擅长将其抓取到数据库中,然后对其进行分析。该公司收集有关旅游和金融服务等数十个行业的定价和产品的数据。企业可以直接使用数据和报告,或者使用与抓取的信息集成的一些机器人流程自动化(RPA)工具构建类似的数据和报告。
Informatica需要干净、最新联系信息的营销团队可以求助于Informatica来组织和更新他们的联系列表。Informatica公司提供的服务混合了验证和丰富的数据。首先,地址和电话号码与地址数据库进行双重检查。然后,Informatica添加来自受信任的企业和消费者来源的详细信息,以构建增强的联系人档案。
Oracle DaaS营销人员渴望获得更好的销售情报,并有机会打开沟通渠道,这是Oracle DaaS产品的主要目标。DaaS数据库为各种企业维护主要和次要联系人的最新信息。该工具将把新的和更新过的姓名和联系人导入到用户的软件中,而不是让其Rolodex保持最新状态。如果使用其他Oracle工具,如Eloqua,则导入路径已经调试好。
Precisely开发人员需要地图上的位置和居住在那里的人们的信息,他们可以通过Precisely找到这些信息。例如,它的人口统计API获取一个地址或位置,并返回一组关于搜索半径内的人员和家庭的汇总统计数据。住宅和商业地产地块通过Property API进行跟踪。一些企业将这些数据用于房地产交易和门店选址规划,另一些企业则使用该数据库通过提前查询找到准确地址,简化了在线零售的结账过程。该公司还建立了数据处理工具的连接,以简化更好分析的开发。
RTI为了保护美国民众的隐私,美国人口普查局将人口调查的数据锁定了72年,而这可能需要很长时间才能进行任何数据分析。RTI采取了不同的方法。它没有提供个性化信息,而是创建了一个以许多重要方式模仿真实数据的合成数据集。如果在真实人口普查中一个街区有58人,可以在合成数据集中找到近58个条目,以及试图接近真实值的虚构细节。任何试图分析人口普查数据的人都可以运行他们的算法,而不必担心个人数据对外泄露。其答案可能与使用真实的东西不完全相同,但对于许多问题,它们的答案将足够接近。这比等待72年才能解锁要好。
Snowflake拥有数据的企业转向Snowflake来存储和分析数据,而不是构建自己的基础设施。该公司提供了一种可扩展、免维护的选项,可以提取结构化和半结构化数据,然后提供各种标准报告和人工智能服务。数据市场还使用户能够买卖他们的数据,以通过相互交流来提高洞察质量。一些特色数据集包括来自MSCI或S&P Global公司的市场研究以及来自Knoema或Starschema的和新冠疫情相关的数据。从人口统计研究到营销、媒体或体育的各种主题都有大量数据集。
Streetlight Data参与城市规划和设计交通网络的部门需要了解居民在城市街道上的活动。Streetlight Data使用匿名的手机记录和政府来源跟踪每个人,以建立一个详细的模型,了解人们何时需要在整个城市中移动。借助Streetlight Data,企业无需构建自己的传感器网络即可获得人流的准确测量数据。
Synthesis AI一般来说,DaaS公司收集有关世界的真实信息。然而,Synthesis AI使用一些为视频游戏和好莱坞动作电影提供动力的3D模型和CGI技术创建其数据。如果想训练机器视觉程序,或者是为了开发和设计自动驾驶汽车,可以找到其需要的尽可能多的测试用例。也许其算法需要在狂欢节上测试一条满是醉酒行人的街道?或者也许是在剧院中的黄昏场景?Synthesis AI可能比电影摄制组生成的任何数据都更快、更全面。