使用“Spark”的项目和产品名称

创建供 Apache Spark 使用的产品和项目的组织,及其相关的营销材料,应注意尊重“Apache Spark”及其徽标的商标权。有关 ASF 商标正确使用的全面且权威的指南,请参阅 ASF 商标指南及相关的 常见问题解答

完全不包含“Spark”的名称与 Spark 项目不存在任何潜在的商标问题。建议采用此类命名方式。

诸如“Spark BigCoProduct”之类的名称是不允许的,通常包含“Spark”的名称亦然。但上述链接中描述了一些例外情况,例如“BigCoProduct, powered by Apache Spark”或“BigCoProduct for Apache Spark”之类的名称。

创建软件标识符(如 Maven 坐标、模块名称等)时使用“spark-foo”是一种常见做法,这是被允许的。在描述中以说明性方式使用商标也始终是被允许的,例如“BigCoProduct is a widget for Apache Spark”。

公司和组织

要将您自己添加到列表中,请发送电子邮件至 dev@spark.apache.org,注明您的组织名称、网址、所使用的 Spark 组件列表以及对您的用例的简短描述。

  • 加州大学伯克利分校 AMPLab - 最初启动 Spark 的大数据研究实验室
    • 我们正在基于 Spark 构建各种开源项目
    • 我们拥有研究生和专业的软件工程师团队致力于该技术栈的开发
  • 4Quant
  • Act Now
    • Spark 为大数据实时预测分析平台 NOW APPS 提供支持。我们使用 Spark SQL、MLlib 和 GraphX 组件进行电信数据的批处理 ETL 和分析,从而为运营商提供更快、更有意义的洞察和可执行的数据。
  • Agile Lab
    • 增强大数据。360度客户视图、日志分析、商业智能 (BI)
  • 阿里巴巴淘宝
    • 我们构建了全球首批 Spark on YARN 生产集群之一。
  • Alluxio
    • Alluxio(前身为 Tachyon)是全球第一个以内存速度统一不同存储系统的系统。
  • 亚马逊 (Amazon)
  • Art.com
    • 趋势分析与个性化
  • 亚信 (AsiaInfo)
    • 我们正在使用 Spark Core、Streaming、MLlib 和 GraphX。我们利用 Spark 和 Hadoop 生态系统为电信行业及其他行业的客户构建经济高效的数据中心解决方案。
  • atp
    • 利用预测模型和学习算法来提高程序化营销的相关性。
    • 所用组件:Spark SQL, MLLib。
  • 欧特克 (Autodesk)
  • 百度 (Baidu)
  • Bakdata – 使用 Spark(和 Shark)对大数据集进行交互式探索
  • Big Industries - 使用 Spark Streaming:Big Content Platform 是一项企业对企业 (B2B) 的内容资产管理服务,提供可搜索、汇总的实时新闻源、公有领域媒体和内容存档。
  • Celtra
  • ClearStory Data – ClearStory 的平台和集成的“数据智能”应用程序利用 Spark 来加速对内部和外部数据源的分析,从而推动全面且可执行的洞察。
  • Concur
    • Spark SQL, MLlib
    • 使用 Spark 进行差旅和费用分析以及个性化
  • Content Square
    • 我们使用 Spark 定期读取原始数据,将其转换为 Parquet 格式,并进行处理以创建高级分析仪表板:聚合、采样、统计计算、异常检测、机器学习。
  • Conviva – Experience Live
  • Credit Karma
    • 我们使用 Spark 创建个性化体验。
  • Databricks
    • Databricks 由 Apache Spark 的原始创建者成立,致力于扩展开源项目并简化大数据和机器学习。我们坚定地致力于将我们在 Spark 上的所有工作保持开源。
    • 我们提供了云优化平台,用于在 Amazon Web Services 和 Azure 上运行 Spark 和 ML 应用程序,并提供全面的培训计划
  • Data Mechanics
    • Data Mechanics 是一个云原生 Spark 平台,可以部署在客户 AWS、GCP 或 Azure 云环境内的 Kubernetes 集群上。
    • 我们的重点是使 Spark 对于数据工程工作负载而言易于使用且具有成本效益。我们还开发了免费的、跨平台的、部分开源的 Spark 监控工具 Data Mechanics Delight。
  • Data Pipelines
    • 通过简单的无代码 UI,逐步构建和调度 ETL 管道。
  • 大众点评网 (Dianping.com)
  • Drawbridge
  • eBay Inc.
    • 使用 Spark Core 进行日志事务聚合和分析
  • Elsevier Labs
    • 用例:构建机器阅读流水线、知识图谱、内容即服务 (CaaS)、内容和事件分析、基于内容/事件的预测模型以及大数据处理。
    • 我们大部分工作都使用 Databricks Notebooks 上的 Scala 和 Python。
  • EURECOM
  • Exabeam
  • Faimdata
    • 在 Spark/Shark/Spark Streaming 之上为零售行业构建电子商务和数据智能解决方案
  • Falkonry
  • Flytxt
    • 用于电信领域用户画像和个性化的大数据分析。我们正在使用 Spark Core 和 MLlib。
  • HHMI 的 Freeman 实验室
    • 我们正在使用 Spark 实时分析和可视化大规模大脑活动记录中的模式
  • Fundacion CTIC
  • GraalSystems
    • GraalSystems 是一个云原生数据平台,可随处使用,包括云环境或裸机基础设施。
  • Groupon
  • GoDataDriven
    • 总部位于阿姆斯特丹的咨询公司,帮助企业利用 Spark 取得成功
  • Guavus
    • 网络机器数据的流处理
  • 日立解决方案 (Hitachi Solutions)
  • The Hive
  • IBM Almaden
  • InfoObjects
    • 屡获殊荣的大数据咨询公司,专注于 Spark 和 Hadoop
  • 浪潮 (Inspur)
  • IOMETE - IOMETE 提供现代化的云驻留数据湖仓平台,将云体验扩展到本地和私有云。利用 Apache Spark 作为查询引擎,我们支持在 AWS、Azure、GCP 或本地运行 Spark 作业和机器学习应用程序。更多信息请访问 IOMETE
  • 伊斯坦布尔谢希尔大学 (Istanbul Sehir University)
  • Kenshoo
    • 数字营销解决方案和预测性媒体优化
  • Kelkoo
    • 使用 Spark Core, SQL 和 Streaming。产品推荐、商业智能 (BI) 与分析、实时恶意活动过滤和数据挖掘。
  • Knoldus Software LLC
  • Localytics
    • 批处理、实时和预测分析,驱动我们的移动应用分析和营销自动化产品。
    • 所用组件:Spark, Spark Streaming, MLLib。
  • MediaCrossing – 纽约和波士顿地区的数字媒体交易专家
    • 我们使用 Spark 作为 Hadoop Map/Reduce 的直接替代品,以便在更短的时间内获得查询的正确答案。
  • MyFitnessPal
    • 使用 Spark 通过显式和隐式用户信号来清理用户输入的食物数据,最终目标是识别高质量的食物项目。
    • 使用 Spark 为食谱和食物构建不同的推荐系统。
  • NASA JPL - 深空网络
  • 网易 (Netease)
  • 诺基亚通信 (Nokia Solutions and Networks)
  • NTT DATA
  • Nube Technologies
    • Nube 提供大规模数据管理解决方案,帮助客户进行目标定位、精确库存管理和高效分析。
  • Ooyala, Inc. – 支持跨屏幕的个性化视频体验
  • Opentable
    • 使用 Apache Spark 进行日志处理和 ETL。获得的数据输入到由 Spark MLLIB 矩阵分解驱动的推荐系统中。我们正在评估将 Spark Streaming 用于实时分析。
  • PanTera
    • PanTera 是一款用于探索大数据集的工具。它使用 Spark 从数百万到数十亿个数据点创建 XY 和地理散点图。
    • 我们使用的组件:Spark Core (Scala API), Spark SQL 和 GraphX
  • PlanBMedia
  • Apache PredictionIO
    • PredictionIO 目前为 Apache Spark MLlib 提供两个引擎模板,用于推荐 (MLlib ALS) 和分类 (MLlib Naive Bayes)。使用这些模板,您可以高效地创建用于生产部署的自定义预测引擎。
  • Premise
  • Quantifind
  • Radius Intelligence
    • 使用 Scala、Spark 和 MLLib 构建 Radius 营销和销售智能平台,包括数据聚合、数据处理、数据聚类、数据分析以及对所有美国企业的预测建模。
  • Real Impact Analytics
    • 为电信运营商构建大规模分析平台
  • RocketFuel
  • RONDHUIT
  • Sailthru
    • 使用 Spark 构建用于营销自动化和个性化的预测模型和推荐系统。
  • 三星美国研究中心 (Samsung Research America)
  • Shopify
  • Simba Technologies
    • 针对 Spark 及其他平台的商业智能/报表/ETL
  • Sinnia
  • SK Telecom
    • SK Telecom 使用 Spark 和 Shark 分析客户的移动使用模式。
  • 搜狐 (Sohu)
  • Stanford DAWN
    • 致力于可用机器学习基础设施的研究实验室,拥有多个在 Apache Spark 之上运行或加速 Apache Spark 的研究项目。
  • Stratio
    • 提供一个以 Apache Spark 为中心的大数据开源平台。
  • Taboola – 为网络上的“您可能喜欢的内容”提供支持
  • 腾讯 (Tencent)
  • Tetra Concepts
  • 趋势科技 (TrendMicro)
  • TripAdvisor
  • 加州大学圣克鲁兹分校 (UC Santa Cruz)
  • 密苏里大学数据分析与发现实验室
  • VideoAmp
    • 针对在线和电视观看受众的智能视频广告。
  • Vistar Media
    • 定位技术公司,助力品牌触达移动中的消费者
  • 雅虎 (Yahoo!)
  • Yandex
    • Yandex Islands 中使用 Spark,用于处理从搜索机器人识别出的“岛屿”。
  • Zaloni
    • Zaloni 的数据湖管理平台 (Bedrock) 和自助式数据准备解决方案 (Mica) 利用 Spark 进行转换和数据探索的快速执行。