使用 "Spark" 的项目和产品名称

创建与 Apache Spark 一起使用的产品和项目的组织,以及相关的营销材料,应注意尊重 “Apache Spark” 及其徽标中的商标。 请参考 ASF 商标指南 和相关的 FAQ,以获得关于正确使用 ASF 商标的全面和权威指导。

完全不包含 “Spark” 的名称不会对 Spark 项目产生潜在的商标问题。 建议这样做。

像 “Spark BigCoProduct” 这样的名称是不可以的,通常包含 “Spark” 的名称也不可以。 然而,上面的链接描述了一些例外情况,例如 “BigCoProduct, powered by Apache Spark” 或 “BigCoProduct for Apache Spark” 之类的名称。

创建软件标识符(Maven 坐标、模块名称等),例如 “spark-foo”,是一种常见的做法。 这是允许的。 在描述中对商标进行描述性使用也始终是被允许的,例如 “BigCoProduct 是一个用于 Apache Spark 的小部件”。

公司和组织

要将自己添加到列表中,请发送电子邮件至 dev@spark.apache.org,其中包含您的组织名称、URL、您正在使用的 Spark 组件列表以及您的用例的简短描述。

  • 加州大学伯克利分校 AMPLab - 最初启动 Spark 的大数据研究实验室
    • 我们正在 Spark 上构建各种开源项目
    • 我们既有研究生,也有一个专业的软件工程师团队在堆栈上工作
  • 4Quant
  • 立即行动
    • Spark 为 NOW APPS 提供支持,NOW APPS 是一个大数据、实时、预测分析平台。 我们使用 Spark SQL、MLlib 和 GraphX 组件进行批量 ETL 和应用于电信数据的分析,从而为运营商提供更快、更有意义的洞察力和可操作的数据。
  • Agile Lab
    • 增强大数据。 360 度客户视图、日志分析、BI
  • 阿里巴巴淘宝
    • 我们构建了世界上第一个基于 YARN 的 Spark 生产集群之一。
  • Alluxio
    • Alluxio(前身为 Tachyon)是世界上第一个在内存速度下统一不同存储系统的系统。
  • Amazon
  • Art.com
    • 趋势分析和个性化
  • AsiaInfo
    • 我们正在使用 Spark Core、Streaming、MLlib 和 Graphx。 我们利用 Spark 和 Hadoop 生态系统为电信行业和其它工业领域的客户构建经济高效的数据中心解决方案。
  • atp
    • 预测模型和学习算法,以提高程序化营销的相关性。
    • 使用的组件:Spark SQL、MLLib。
  • Autodesk
  • 百度
  • Bakdata – 使用 Spark (和 Shark) 执行大型数据集的交互式探索
  • Big Industries - 使用 Spark Streaming:Big Content Platform 是一种企业对企业的内容资产管理服务,提供可搜索的、聚合的实时新闻源、公共领域媒体和内容档案。
  • Celtra
  • ClearStory Data – ClearStory 的平台和集成的 Data Intelligence 应用程序利用 Spark 加速跨内部和外部数据源的分析,从而驱动整体的和可操作的洞察力。
  • Concur
    • Spark SQL, MLlib
    • 使用 Spark 进行旅行和费用分析以及个性化<
  • Content Square
    • 我们使用 Spark 定期读取原始数据,将其转换为 Parquet,并对其进行处理以创建高级分析仪表板:聚合、采样、统计计算、异常检测、机器学习。
  • Conviva – 体验直播
  • Credit Karma
    • 我们使用 Spark 创建个性化体验。
  • Databricks
    • Databricks 由 Apache Spark 的原始创建者创立,致力于扩展开源项目并简化大数据和机器学习。 我们坚定地致力于保持我们在 Spark 上的所有工作的开源性。
    • 我们提供了一个 云优化平台,用于在 Amazon Web Services 和 Azure 上运行 Spark 和 ML 应用程序,以及一个全面的 培训计划
  • Data Mechanics
    • Data Mechanics 是一个云原生 Spark 平台,可以部署在其客户的 AWS、GCP 或 Azure 云环境中的 Kubernetes 集群上。
    • 我们的重点是使 Spark 易于使用且具有成本效益,适用于数据工程工作负载。 我们还开发了免费的、跨平台的和部分开源的 Spark 监控工具 Data Mechanics Delight.
  • Data Pipelines
    • 通过一个简单的无代码 UI 逐步构建和调度 ETL 管道。
  • Dianping.com
  • Drawbridge
  • eBay Inc.
    • 使用 Spark core 进行日志事务聚合和分析
  • Elsevier Labs
    • 用例:构建机器阅读管道、知识图谱、内容即服务、内容和事件分析、基于内容/事件的预测模型以及大数据处理。
    • 我们对大部分工作都使用 Scala 和 Python 以及 Databricks Notebooks。
  • EURECOM
  • Exabeam
  • Faimdata
    • 在 Spark/Shark/Spark Streaming 之上为零售业构建电子商务和数据情报解决方案
  • Falkonry
  • Flytxt
    • 电信领域用于订户画像和个性化的大数据分析。 我们正在使用 Spark Core 和 MLlib。
  • Freeman Lab at HHMI
    • 我们正在使用 Spark 实时分析和可视化大规模大脑活动记录中的模式
  • Fundacion CTIC
  • GraalSystems
    • GraalSystems 是一个云原生数据平台,可以在任何地方使用,包括云环境或裸机基础设施。
  • Groupon
  • GoDataDriven
    • 位于阿姆斯特丹的咨询公司,帮助公司成功使用 Spark
  • Guavus
    • 网络机器数据的流处理
  • Hitachi Solutions
  • The Hive
  • IBM Almaden
  • InfoObjects
    • 屡获殊荣的大数据咨询公司,专注于 Spark 和 Hadoop
  • Inspur
  • IOMETE - IOMETE 提供了一个现代化的云内数据湖仓一体平台,将类似云的体验扩展到本地部署和私有云。 利用 Apache Spark 作为查询引擎,我们能够在 AWS、Azure、GCP 或本地部署上运行 Spark 作业和 ML 应用程序。 在 IOMETE 上了解更多信息。
  • Istanbul Sehir University
  • Kenshoo
    • 数字营销解决方案和预测性媒体优化
  • Kelkoo
    • 使用 Spark Core、SQL 和 Streaming。 产品推荐、BI 和分析、实时恶意活动过滤以及数据挖掘。
  • Knoldus Software LLC
  • Localytics
    • 驱动我们的移动应用分析和营销自动化产品的批量、实时和预测分析。
    • 使用的组件:Spark、Spark Streaming、MLLib。
  • MediaCrossing – 纽约和波士顿地区的数字媒体交易专家
    • 我们正在使用 Spark 作为 Hadoop Map/Reduce 的直接替代品,以便在更短的时间内获得查询的正确答案。
  • MyFitnessPal
    • 使用 Spark 通过显式和隐式用户信号清理用户输入的食物数据,最终目标是识别高质量的食物项目。
    • 使用 Spark 为食谱和食物构建不同的推荐系统。
  • NASA JPL - 深空网络
  • Netease
  • Nokia Solutions and Networks
  • NTT DATA
  • Nube Technologies
    • Nube 提供大规模数据管理解决方案,帮助客户定位、准确库存和高效分析。
  • Ooyala, Inc. – 为所有屏幕提供个性化视频体验
  • Opentable
    • 使用 Apache Spark 进行日志处理和 ETL。 获取的数据为由 Spark MLLIB 矩阵分解驱动的推荐系统提供支持。 我们正在评估使用 Spark Streaming 进行实时分析。
  • PanTera
    • PanTera 是一款用于探索大型数据集的工具。 它使用 Spark 从数百万到数十亿个数据点创建 XY 和地理散点图。
    • 我们正在使用的组件:Spark Core (Scala API)、Spark SQL 和 GraphX
  • PlanBMedia
  • Apache PredictionIO
    • PredictionIO 目前为 Apache Spark MLlib 提供了两个引擎模板,用于推荐(MLlib ALS)和分类(MLlib Naive Bayes)。 使用这些模板,您可以有效地为生产部署创建自定义的预测引擎。
  • Premise
  • Quantifind
  • Radius Intelligence
    • 将 Scala、Spark 和 MLLib 用于 Radius 营销和销售情报平台,包括美国所有业务的数据聚合、数据处理、数据聚类、数据分析和预测建模。
  • Real Impact Analytics
    • 为电信运营商构建大规模分析平台
  • RocketFuel
  • RONDHUIT
  • Sailthru
    • 使用 Spark 构建预测模型和推荐系统,用于营销自动化和个性化。
  • Samsung Research America
  • Shopify
  • Simba Technologies
    • Spark 及其他领域的 BI/报告/ETL
  • Sinnia
  • SK Telecom
    • SK Telecom 使用 Spark 和 Shark 分析客户的移动使用模式。
  • Sohu
  • Stanford DAWN
    • 研究实验室,专注于可用机器学习的基础设施,拥有多个在 Apache Spark 上运行或加速 Apache Spark 的研究项目。
  • Stratio
    • 提供一个围绕 Apache Spark 构建的开源大数据平台。
  • Taboola – 为网络提供“您可能喜欢的内容”
  • 腾讯
  • Tetra Concepts
  • 趋势科技
  • TripAdvisor
  • 加州大学圣克鲁兹分校
  • 密苏里大学数据分析和发现实验室
  • VideoAmp
    • 面向在线和电视观众的智能视频广告。
  • Vistar Media
    • 位置技术公司,使品牌能够触达旅途中的消费者
  • 雅虎!
  • Yandex
    • Yandex Islands 中使用 Spark,处理从搜索机器人识别出的 Islands。
  • Zaloni
    • Zaloni 的数据湖管理平台 (Bedrock) 和自助数据准备解决方案 (Mica) 利用 Spark 来快速执行转换和数据探索。