Amazon Web Services - Redshift
Amazon Redshifté um serviço de data warehouse totalmente gerenciado na nuvem. Seus conjuntos de dados variam de centenas de gigabytes a um petabyte. O processo inicial para criar um data warehouse é lançar um conjunto de recursos computacionais chamadosnodes, que são organizados em grupos chamados cluster. Depois disso, você pode processar suas consultas.
Como configurar o Amazon Redshift?
A seguir estão as etapas para configurar o Amazon Redshift.
Step 1 - Faça login e inicie um cluster Redshift usando as seguintes etapas.
Faça login no console de gerenciamento da AWS e use o seguinte link para abrir o console do Amazon Redshift - https://console.aws.amazon.com/redshift/
Selecione a região onde o cluster deve ser criado usando o menu Região no canto superior direito da tela.
Clique no botão Launch Cluster.
A página Detalhes do cluster é aberta. Forneça os detalhes necessários e clique no botão Continuar até a página de revisão.
Uma página de confirmação é aberta. Clique no botão Fechar para terminar de forma que o cluster fique visível na lista Clusters.
Selecione o cluster na lista e revise as informações de status do cluster. A página mostrará o status do cluster.
Step 2- Configure o grupo de segurança para autorizar conexões de clientes ao cluster. A autorização de acesso ao Redshift depende se o cliente autoriza uma instância EC2 ou não.
Siga estas etapas para o grupo de segurança na plataforma EC2-VPC.
Abra o Amazon Redshift Console e clique em Clusters no painel de navegação.
Selecione o Cluster desejado. Sua guia de configuração é aberta.
Clique no grupo Segurança.
Quando a página do grupo Segurança for aberta, clique na guia Entrada.
Clique no botão Editar. Defina os campos conforme mostrado abaixo e clique no botão Salvar.
Type - Regra TCP personalizada.
Protocol - TCP.
Port Range- Digite o mesmo número de porta usado ao iniciar o cluster. Por padrão, a porta do Amazon Redshift é 5439.
Source - Selecione IP personalizado e digite 0.0.0.0/0.
Step 3 - Conecte-se ao Redshift Cluster.
Existem duas maneiras de se conectar ao Redshift Cluster - diretamente ou via SSL.
A seguir estão as etapas para se conectar diretamente.
Conecte o cluster usando uma ferramenta de cliente SQL. Ele oferece suporte a ferramentas de cliente SQL que são compatíveis com drivers PostgreSQL JDBC ou ODBC.
Use os seguintes links para fazer o download - JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar
ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip ou http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip para máquinas de 64 bits
Use as etapas a seguir para obter a string de conexão.
Abra o Amazon Redshift Console e selecione Cluster no painel de navegação.
Selecione o cluster de sua escolha e clique na guia Configuração.
Uma página é aberta, conforme mostrado na captura de tela a seguir, com URL JDBC em Propriedades do banco de dados de cluster. Copie o URL.
Use as etapas a seguir para conectar o Cluster com SQL Workbench / J.
Abra o SQL Workbench / J.
Selecione o arquivo e clique na janela Conectar.
Selecione Criar um novo perfil de conexão e preencha os detalhes necessários, como nome, etc.
Clique em Gerenciar Drivers e a caixa de diálogo Gerenciar Drivers é aberta.
Clique no botão Criar uma nova entrada e preencha os detalhes necessários.
Clique no ícone da pasta e navegue até o local do driver. Por fim, clique no botão Abrir.
Deixe as caixas Classname e Sample URL em branco. Clique OK.
Escolha o driver na lista.
No campo URL, cole o URL JDBC copiado.
Digite o nome de usuário e a senha em seus respectivos campos.
Selecione a caixa Autocommit e clique em Salvar lista de perfis.
Recursos do Amazon Redshift
A seguir estão os recursos do Amazon Redshift -
Supports VPC - Os usuários podem iniciar o Redshift no VPC e controlar o acesso ao cluster por meio do ambiente de rede virtual.
Encryption - Os dados armazenados no Redshift podem ser criptografados e configurados ao criar tabelas no Redshift.
SSL - A criptografia SSL é usada para criptografar conexões entre clientes e Redshift.
Scalable- Com alguns cliques simples, o número de nós pode ser facilmente dimensionado em seu data warehouse Redshift conforme a necessidade. Ele também permite dimensionar a capacidade de armazenamento sem qualquer perda de desempenho.
Cost-effective- O Amazon Redshift é uma alternativa econômica às práticas tradicionais de armazenamento de dados. Não há custos iniciais, compromissos de longo prazo e estrutura de preços sob demanda.