Tecnologia

O que é o Amazon Athena? O | TechRadar



As respostas que as empresas precisam de seus dados podem às vezes ser ilusórias. Vivemos em uma época em que os dados são abundantes, especialmente com a expansão para o armazenamento em nuvem. Mas as ferramentas para analisar e processar esses dados nem sempre são fáceis de usar, são muito acessíveis ou até tão eficazes. O problema? Os dados devem residir em algum lugar, e a maioria das empresas precisa pensar em como eles são armazenados, quem os acessará, como torná-los seguros e, o mais importante, como tornar o acesso aos dados confiável e rápido.

É aí que o Amazon Athena pode ajudar. É um serviço de consulta no qual as empresas podem executar consultas SQL em seus dados como se residissem em um data center local. Ele não possui servidor, pois você não precisa gerenciar a infraestrutura ou usar o software de banco de dados para gerenciá-la. E é extremamente rápido. Sua equipe pode executar consultas SQL e esperar resultados mesmo em grandes conjuntos de dados em questão de segundos.

Para usar o Amazon Athena, os dados são hospedados pela primeira vez no Amazon S3 (Simple Storage Service), que é um serviço de armazenamento de objetos executado na nuvem. O Amazon S3 é o que torna os dados acessíveis e seguros, enquanto o Amazon Athena é o serviço de consulta que fornece a capacidade de obter os resultados que você precisa dos dados. Isso significa que você não precisa se preocupar com Design de banco de dados.

Uma maneira de pensar em Athena? É algo semelhante a uma pesquisa no Google. Você sabe que os dados estão disponíveis, mas geralmente é difícil encontrar os conjuntos de dados que você realmente precisa. Uma consulta é semelhante a uma pesquisa do Google, pois cria os parâmetros para a consulta SQL que você precisa executar. A diferença aqui é que você está usando serviços de computação em nuvem em vez de um mecanismo de pesquisa.

Isso não é algo que requer instalação ou configuração, o que geralmente ocorre com um armazenamento de dados local e pode envolver um ETL (Extrair, Transformar, Carregar) que prepara os dados em um banco de dados para uma consulta que isola o conjunto de dados. . Em vez disso, sua consulta pode ser executada sem o uso de ETL e, portanto, simplifica o processo: execute a consulta em um console da Web fácil de usar. Indique seus dados no S3, configure o esquema e inicie a consulta.

Um exemplo de como isso poderia funcionar é uma empresa de varejo que vende um grande número de produtos com milhares ou até milhões de unidades de estoque. Uma empresa pode querer saber se existem SKUs que devem ser retirados. Normalmente, isso pode exigir a preparação de um ETL complexo para configurar e preparar os dados para consultas SQL. Por causa de como o armazenamento de objetos funciona no Amazon S3 e a integração sem outros serviços da Web da Amazon (como o AWS Glue Data Catalog), as consultas funcionam sem qualquer preparação.

Isso significa que as empresas podem executar uma consulta transacional no ponto de venda, como a relacionada às SKUs retiradas ou tornar outras consultas mais rápidas e com melhores resultados.

Benefícios do Amazon Athena

Como na maioria dos serviços web da Amazon, o principal benefício do uso do Amazon Athena é que ele oferece grande flexibilidade na maneira como você executa consultas sem a complexidade adicional. Um exemplo disso é com uma empresa farmacêutica que usa a nuvem para pesquisa genômica. Sua equipe pode decidir executar várias consultas no conjunto de dados, mas geralmente cada uma exige instalação e configuração para criar um banco de dados na nuvem que possa aceitar as consultas. Com o Athena, a equipe pode executar várias consultas simultâneas ao mesmo tempo, mas confia que os resultados serão limpos e acessíveis em questão de segundos. Esses resultados de consulta acionáveis ​​significam que as empresas têm acesso a dados limpos e confiáveis ​​para tomar melhores decisões e continuar suas pesquisas.

Outra vantagem do Athena relacionada a isso é um custo menor. As empresas não precisam gerenciar a área de cobertura necessária para os conjuntos de dados; portanto, se executam várias consultas ou precisam tomar decisões relacionadas a um grande tesouro de dados, não precisam primeiro melhorar a infraestrutura de TI ou configurar seus dados de armazenamento para lidar com O maior número de solicitações. Athena expande e retrai as variáveis ​​de desempenho conforme necessário para as consultas em questão.

Como mencionado anteriormente, o Athena é flexível o suficiente para lidar com uma variedade de tarefas relacionadas às consultas ao banco de dados. Ele executa SQL padrão e suporta formatos de dados padrão, como CSV, JSON, ORC, Avro e Parquet. O Athena usa o Presto, um mecanismo de consulta SQL de código aberto, com suporte a ANSI SQL, portanto, não é um serviço de consulta patenteado que os usuários terão que aprender do zero. O Athena permite que você execute consultas SQL rápidas, mas também suporta combinações e matrizes mais complexas.

No final, o poder entra em jogo com o Amazon Athena porque ele é executado no Amazon S3; portanto, todos os benefícios dessa plataforma de armazenamento de objetos para seu banco de dados são transferidos para o Athena em termos de redução de complexidade, fornecendo a segurança e o desempenho do terminal necessário e permitem que as empresas executem várias consultas sem precisar gerenciar ou configurar a infraestrutura. As empresas podem se concentrar mais em consultas e resultados reais, não na plataforma em si.



Source link

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo