Phân tích dữ liệu ở quy mô petabyte một cách dễ dàng và linh hoạt
Trong workshop này, chúng ta sẽ khám phá các tính năng của Amazon Athena và điều hành các phòng thí nghiệm thực hành nhằm chứng minh các tính năng cũng như phương pháp thực hành tốt nhất của Amazon Athena.
Amazon Athena là một dịch vụ phân tích tương tác, không có máy chủ, được xây dựng trên các khung nguồn mở, hỗ trợ các định dạng tệp và bảng mở. Athena cung cấp một cách đơn giản, linh hoạt để phân tích hàng petabyte dữ liệu nơi nó tồn tại. Phân tích dữ liệu hoặc xây dựng ứng dụng từ hồ dữ liệu Amazon Simple Storage Service (S3) và 30 nguồn dữ liệu, bao gồm nguồn dữ liệu tại chỗ hoặc các hệ thống đám mây khác sử dụng SQL hoặc Python. Athena được xây dựng trên các công cụ Trino và Presto mã nguồn mở cũng như các khung Apache Spark mà không cần nỗ lực cung cấp hoặc cấu hình.
Sơ đồ minh họa cách Amazon Athena truy vấn dữ liệu từ kho dữ liệu, kho dữ liệu và các nguồn khác, chạy tại cơ sở hoặc trên đám mây.