由 Spark 提供支持 | Apache Spark

使用“Spark”的项目和产品名称

创建与 Apache Spark 配合使用的产品和项目的组织，以及相关的营销材料，应注意尊重“Apache Spark”及其标志中的商标。有关 ASF 商标正确使用的全面和权威指导，请参阅 ASF 商标指南和相关常见问题。

不包含“Spark”的名称与 Spark 项目没有潜在的商标问题。这是推荐的做法。

诸如“Spark BigCoProduct”之类的名称是不允许的，通常包含“Spark”的名称也一样。然而，上述链接描述了一些例外情况，例如“由 Apache Spark 提供支持的 BigCoProduct”或“适用于 Apache Spark 的 BigCoProduct”等名称。

创建诸如“spark-foo”之类的软件标识符（Maven 坐标、模块名称等）是常见做法。这些是允许的。在描述中提名使用商标也始终是允许的，例如“BigCoProduct 是 Apache Spark 的一个组件”。

公司和组织

要将您的组织添加到此列表，请发送电子邮件至 dev@spark.apache.org，并提供您的组织名称、网址、您正在使用的 Spark 组件列表以及您的使用案例的简短描述。

加州大学伯克利分校 AMPLab - 最初启动 Spark 的大数据研究实验室
- 我们正在 Spark 上构建各种开源项目
- 我们有研究生和专业的软件工程师团队致力于该技术栈
4Quant
Act Now
- Spark 为 NOW APPS 提供支持，这是一个大数据、实时、预测分析平台。我们使用 Spark SQL、MLlib 和 GraphX 组件进行批处理 ETL 和应用于电信数据的分析，为运营商提供更快、更有意义的洞察和可操作的数据。
Agile Lab
- 增强大数据。360 度客户视图、日志分析、商业智能 (BI)
阿里巴巴淘宝
- 我们构建了世界上首批基于 YARN 的 Spark 生产集群之一。
Alluxio
- Alluxio，前身为 Tachyon，是世界上第一个以内存速度统一不同存储系统的系统。
亚马逊
Art.com
- 趋势分析和个性化
亚信
- 我们正在使用 Spark Core、Streaming、MLlib 和 Graphx。我们利用 Spark 和 Hadoop 生态系统为电信行业客户以及其他工业部门构建具有成本效益的数据中心解决方案。
atp
- 预测模型和学习算法，以提高程序化营销的相关性。
- 使用的组件：Spark SQL，MLLib。
欧特克
百度
Bakdata – 使用 Spark (和 Shark) 进行大型数据集的交互式探索
Big Industries - 使用 Spark Streaming：Big Content Platform 是一种企业对企业的内容资产管理服务，提供可搜索、聚合的实时新闻源、公共领域媒体和内容档案。
Celtra
ClearStory Data – ClearStory 的平台和集成式数据智能应用程序利用 Spark 加速内部和外部数据源的分析，从而推动全面的、可操作的洞察。
Concur
- Spark SQL, MLlib
- 使用 Spark 进行差旅和费用分析以及个性化
Content Square
- 我们使用 Spark 定期读取原始数据，将其转换为 Parquet 格式，并进行处理以创建高级分析仪表板：聚合、抽样、统计计算、异常检测、机器学习。
Conviva – 体验实时
- 请参阅我们在 AmpCamp 上的演讲，了解我们如何使用 Spark 提供实时视频优化
Credit Karma
- 我们使用 Spark 创建个性化体验。
Databricks
- Databricks 由 Apache Spark 的原始创建者组建，致力于扩展开源项目并简化大数据和机器学习。我们坚定不移地致力于将我们在 Spark 上的所有工作保持开源。
- 我们提供了一个云优化的平台，可在 Amazon Web Services 和 Azure 上运行 Spark 和机器学习应用程序，并提供全面的培训计划。
Data Mechanics
- Data Mechanics 是一个云原生 Spark 平台，可以部署在客户的 AWS、GCP 或 Azure 云环境中的 Kubernetes 集群上。
- 我们的重点是让 Spark 易于使用且经济高效地处理数据工程工作负载。我们还开发了免费、跨平台、部分开源的 Spark 监控工具 Data Mechanics Delight。
数据管道
- 通过简单的无代码 UI 逐步构建和调度 ETL 管道。
大众点评网
Drawbridge
eBay 公司
- 使用 Spark core 进行日志事务聚合和分析
Elsevier 实验室
- 用例：构建机器阅读管道、知识图谱、内容即服务、内容和事件分析、基于内容/事件的预测模型和大数据处理。
- 我们的大部分工作都通过 Databricks Notebooks 使用 Scala 和 Python。
EURECOM
Exabeam
Faimdata
- 在 Spark/Shark/Spark Streaming 之上为零售业构建电子商务和数据智能解决方案
Falkonry
Flytxt
- 电信领域用户画像和个性化的大数据分析。我们正在使用 Spark Core 和 MLlib。
HHMI 的 Freeman 实验室
- 我们正在使用 Spark 实时分析和可视化大规模脑电活动记录中的模式
Fundacion CTIC
GraalSystems
- GraalSystems 是一个云原生数据平台，可在云环境或裸机基础设施上随处使用。
Groupon
GoDataDriven
- 一家位于阿姆斯特丹的咨询公司，帮助企业成功使用 Spark
Guavus
- 网络机器数据的流处理
日立解决方案
The Hive
IBM 阿尔马登
InfoObjects
- 屡获殊荣的大数据咨询公司，专注于 Spark 和 Hadoop
浪潮
IOMETE - IOMETE 提供一个现代化的云端湖仓一体平台，将云端体验扩展到本地和私有云。我们利用 Apache Spark 作为查询引擎，支持在 AWS、Azure、GCP 或本地运行 Spark 作业和 ML 应用程序。在 IOMETE 了解更多信息。
伊斯坦布尔城市大学
Kenshoo
- 数字营销解决方案和预测性媒体优化
Kelkoo
- 使用 Spark Core、SQL 和 Streaming。产品推荐、商业智能和分析、实时恶意活动过滤以及数据挖掘。
Knoldus 软件有限责任公司
Localytics
- 批处理、实时和预测分析，驱动我们的移动应用分析和营销自动化产品。
- 使用的组件：Spark, Spark Streaming, MLLib。
MediaCrossing – 纽约和波士顿地区的数字媒体交易专家
- 我们使用 Spark 作为 Hadoop Map/Reduce 的直接替代品，以更短的时间获得查询的正确结果。
MyFitnessPal
- 使用 Spark 清理用户输入的食物数据，结合显性和隐性用户信号，最终目标是识别高质量食物条目。
- 使用 Spark 为食谱和食物构建不同的推荐系统。
NASA JPL - 深空网络
网易
诺基亚解决方案与网络
NTT DATA
Nube Technologies
- Nube 提供大规模数据整理解决方案，帮助客户定位、准确库存和高效分析。
Ooyala 公司 – 在所有屏幕上提供个性化视频体验
- 请参阅我们关于如何使用 Spark 进行快速查询的博客文章
- 请参阅我们关于 Cassandra、Spark 和 Shark 的演示文稿
Opentable
- 使用 Apache Spark 进行日志处理和 ETL。获取的数据用于由 Spark MLLIB 矩阵分解驱动的推荐系统。我们正在评估使用 Spark Streaming 进行实时分析。
PanTera
- PanTera 是一个探索大型数据集的工具。它使用 Spark 从数百万到数十亿个数据点创建 XY 和地理散点图。
- 我们正在使用的组件：Spark Core (Scala API)、Spark SQL 和 GraphX
PlanBMedia
Apache PredictionIO
- PredictionIO 目前为 Apache Spark MLlib 提供了两个引擎模板，用于推荐（MLlib ALS）和分类（MLlib Naive Bayes）。借助这些模板，您可以高效地创建用于生产部署的自定义预测引擎。
Premise
Quantifind
Radius Intelligence
- 使用 Scala、Spark 和 MLLib 为 Radius 营销和销售智能平台提供支持，包括所有美国企业的数据聚合、数据处理、数据聚类、数据分析和预测建模。
Real Impact Analytics
- 为电信运营商构建大规模分析平台
RocketFuel
RONDHUIT
- 使用 Apache Mahout 和 Spark 进行机器学习 http://www.rondhuit.com/services/training/mahout-ML.html
Sailthru
- 使用 Spark 构建预测模型和推荐系统，用于营销自动化和个性化。
三星美国研究院
Shopify
Simba Technologies
- 适用于 Spark 及更广泛领域的 BI/报告/ETL
Sinnia
SK 电信
- SK 电信使用 Spark 和 Shark 分析客户的移动使用模式。
搜狐
斯坦福 DAWN
- 可用机器学习基础设施研究实验室，拥有多个基于或加速 Apache Spark 的研究项目。
Stratio
- 提供围绕 Apache Spark 构建的开源大数据平台。
Taboola – 在网络上提供“您可能喜欢的内容”
腾讯
Tetra Concepts
趋势科技
TripAdvisor
加州大学圣克鲁斯分校
密苏里大学数据分析与发现实验室
VideoAmp
- 面向在线和电视观众的智能视频广告。
Vistar Media
- 位置技术公司，帮助品牌触达移动中的消费者
雅虎！
Yandex
- 在 Yandex Islands 中使用 Spark，处理从搜索机器人识别出的 Islands
Zaloni
- Zaloni 的数据湖管理平台 (Bedrock) 和自助式数据准备解决方案 (Mica) 利用 Spark 快速执行数据转换和数据探索。

使用“Spark”的项目和产品名称

公司和组织

最新消息