数据科学

数据科学,AI和机器学习如何合作

在facebook上分享
分享到Twitter
分享LinkedIn.
在whatsapp分享

机器人会梦到电子羊吗?

作家菲利普·迪克(Philip K. Dick)在1968年的小说《银翼杀手》(Blade Runner)的标题中提出了这个问题。这个故事的潜在主题包括机器人中有知觉的人工智能的伦理和哲学。在故事的“未来设定”2019年两年后,人类正在探索更具体的人工智能用例,这些用例与科幻故事中的完全不同。许多人不再需要区分机器人“复制人”和真人,而是努力消除数据科学、人工智能(AI)和机器学习(ML)等术语的歧义。

这些术语都成为商业和科技界常见的流行语。但完全了解什么数据科学,AI和机器学习意味着以及如何利用他们的优势对于21世纪的任何数字娴熟的组织至关重要。

数据科学与AI的兴起

数据科学领域从根本组织和使用数据来提供人为决策的见解。对于初创公司和《财富》500强公司来说,发展从数据中收集见解的能力已经变得至关重要。许多组织已经从物理传感器和数百万人的在线活动中收集了前所未有的大量数据,但一堆未经组织的数据本身不会产生深刻的见解。

这是数据科学家通过清理和组织数据来发挥的地方,以使其适合分析。它们还构建分析数据所需的统计模型,以揭示显着的模式或趋势。在近年来,他们的职责扩展了使用计算机编程来创建使数据分析更有效的工具。

数据科学家的所有这些工作为以下几类关键数据分析铺平了道路:

  • 描述性分析旨在洞察当前或历史数据趋势。
  • 预测分析通过使用最好的数据进行预测来洞察未来的未知。
  • 规范的分析可以推荐人类应该做什么,给出可用的数据洞察力。

在充分利用数据科学方面,人类越来越多地与机器合作。现代人工智能的出现基于机器学习大大提高了预测性和规定性分析。

以最广泛的实际术语,AI是指一组工具,可以以模仿智能行为的方式自动化机器操作。与科幻小说中有关人工智能展现出一般人类水平智能的故事相反,大多数现代人工智能系统只有一套非常狭窄的能力,旨在为各种应用程序执行特定任务。

这些应用的一个小样本可能包括:

  • 视觉识别社交媒体照片中的猫和狗
  • 在网站上发现的文本中的不同语言之间翻译
  • 检测患者X射线图像中癌症的可能迹象

现代人工智能系统中的机器学习

大多数现代AI基于机器学习:一类可以自动从数据学习的计算机算法。而不是依靠人类来编程每一步,ML模型在大型数据集上列车,以确定数据中的标记模式,并根据该信息进行自己的预测。然后,他们可以将从培训数据集中学到的经验教训应用于现实世界中的完全新的和不熟悉的数据集。

培训数据的重要性意味着ML性能大大取决于访问高质量的大型和多样化的数据集。例如,通过仅通过查看西伯利亚哈士奇的100张图像来识别狗的机器学习模型不太可能在突然任务时表现出良好的时间,当突然任务,识别来自各种狗品种的数千种图像。

这就是人类仍然具有重要手的一个原因,在开发和改善机器学习模型中。人们通常可以通过标签识别每条训练数据的工作 - 例如通过标签识别每个狗图像 - 以便机器学习模型可以从这些示例中学习。它们还可以在培训过程中改变某些参数,以便轻动机器学习模型,以产生更准确的结果。

ML模型可以遵循几种不同的方法:

  • 监督学习严重依赖于手工标记的训练数据集,是最常见的机器学习类型。
  • 无监督学习对未标记的数据进行筛选,试图找到可能逃过人眼的不寻常模式。
  • 强化学习是通过尝试和犯错来从错误中学习,从而更接近于实现一个特定的目标。
数据科学、人工智能和ML的区别

人类和机器智能的结合

无论如何,ML已经成为人工智能和人类决策的非常有用的工具。对于支持谷歌搜索引擎和Netflix推荐的人工智能系统,ML已经自动化了从真实世界的数据学习的大部分过程,并根据反馈不断改进性能。

机器学习也一直在帮助数据科学家实现大部分分析建模过程的自动化,否则这些过程将不得不手工完成。这让数据科学家可以花更多时间帮助组织理解并将数据见解转化为有影响力的行动。

这只是基于机器学习的数据科学如何与AI相交的一个例子。让我们假设互联网搜索引擎公司想要提供并通过响应查询提供最相关的在线搜索:“儿童过敏药物”。

  • 数据科学家帮助收集和组织包含数百万与儿童过敏药物相关的用户搜索结果的大型数据集。然后,他们与软件开发人员和工程师合作,建立从这些数据集学习的机器学习模型。
  • 通过培训,机器学习模型可以识别用户对各种搜索结果的偏好,比如哪些过敏药物以糖浆和咀嚼片的形式出现。这有助于不断更新搜索引擎,从而提供更多相关的结果,并将其排名更高。
  • 机器学习模型识别的搜索和点击趋势还提供了人们的医疗需求和购物习惯的信息,比如某些过敏药品牌在一年的特定时间在特定地理区域的家庭中更受欢迎。数据科学家通过分析这些趋势,找到可以与企业领导人和在线广告商分享的商业见解。

当与数据科学结合时,ML关于行业和市场趋势的预测可以产生大型洞察,以通知C-Suite关于推出新产品或服务的决定。他们还可以提供即时和可操作的洞察力,了解员工应该如何处理特定的客户投诉或协助购物决定。选择投资于利用数据科学、ML和AI的能力的组织可以在各个层次上加强他们的人类决策。

与我们合作

在La188bet金宝搏彩票teveview Analytics,我们的数据科学专家抓住机会,了解大数据,并将其视为客户的洞察力,以使数据驱动的业务决策。与我们联系marketing@latentview.com.了解更多。