Amazon Web Services - Redshift

Amazon Redshifté um serviço de data warehouse totalmente gerenciado na nuvem. Seus conjuntos de dados variam de centenas de gigabytes a um petabyte. O processo inicial para criar um data warehouse é lançar um conjunto de recursos computacionais chamadosnodes, que são organizados em grupos chamados cluster. Depois disso, você pode processar suas consultas.

Como configurar o Amazon Redshift?

A seguir estão as etapas para configurar o Amazon Redshift.

Step 1 - Faça login e inicie um cluster Redshift usando as seguintes etapas.

  • Faça login no console de gerenciamento da AWS e use o seguinte link para abrir o console do Amazon Redshift - https://console.aws.amazon.com/redshift/

  • Selecione a região onde o cluster deve ser criado usando o menu Região no canto superior direito da tela.

  • Clique no botão Launch Cluster.

  • A página Detalhes do cluster é aberta. Forneça os detalhes necessários e clique no botão Continuar até a página de revisão.

  • Uma página de confirmação é aberta. Clique no botão Fechar para terminar de forma que o cluster fique visível na lista Clusters.

  • Selecione o cluster na lista e revise as informações de status do cluster. A página mostrará o status do cluster.

Step 2- Configure o grupo de segurança para autorizar conexões de clientes ao cluster. A autorização de acesso ao Redshift depende se o cliente autoriza uma instância EC2 ou não.

Siga estas etapas para o grupo de segurança na plataforma EC2-VPC.

  • Abra o Amazon Redshift Console e clique em Clusters no painel de navegação.

  • Selecione o Cluster desejado. Sua guia de configuração é aberta.

  • Clique no grupo Segurança.

  • Quando a página do grupo Segurança for aberta, clique na guia Entrada.

  • Clique no botão Editar. Defina os campos conforme mostrado abaixo e clique no botão Salvar.

    • Type - Regra TCP personalizada.

    • Protocol - TCP.

    • Port Range- Digite o mesmo número de porta usado ao iniciar o cluster. Por padrão, a porta do Amazon Redshift é 5439.

    • Source - Selecione IP personalizado e digite 0.0.0.0/0.

Step 3 - Conecte-se ao Redshift Cluster.

Existem duas maneiras de se conectar ao Redshift Cluster - diretamente ou via SSL.

A seguir estão as etapas para se conectar diretamente.

  • Conecte o cluster usando uma ferramenta de cliente SQL. Ele oferece suporte a ferramentas de cliente SQL que são compatíveis com drivers PostgreSQL JDBC ou ODBC.

    Use os seguintes links para fazer o download - JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar

    ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip ou http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip para máquinas de 64 bits

  • Use as etapas a seguir para obter a string de conexão.

    • Abra o Amazon Redshift Console e selecione Cluster no painel de navegação.

    • Selecione o cluster de sua escolha e clique na guia Configuração.

    • Uma página é aberta, conforme mostrado na captura de tela a seguir, com URL JDBC em Propriedades do banco de dados de cluster. Copie o URL.

  • Use as etapas a seguir para conectar o Cluster com SQL Workbench / J.

    • Abra o SQL Workbench / J.

    • Selecione o arquivo e clique na janela Conectar.

    • Selecione Criar um novo perfil de conexão e preencha os detalhes necessários, como nome, etc.

    • Clique em Gerenciar Drivers e a caixa de diálogo Gerenciar Drivers é aberta.

    • Clique no botão Criar uma nova entrada e preencha os detalhes necessários.

  • Clique no ícone da pasta e navegue até o local do driver. Por fim, clique no botão Abrir.

  • Deixe as caixas Classname e Sample URL em branco. Clique OK.

  • Escolha o driver na lista.

  • No campo URL, cole o URL JDBC copiado.

  • Digite o nome de usuário e a senha em seus respectivos campos.

  • Selecione a caixa Autocommit e clique em Salvar lista de perfis.

Recursos do Amazon Redshift

A seguir estão os recursos do Amazon Redshift -

  • Supports VPC - Os usuários podem iniciar o Redshift no VPC e controlar o acesso ao cluster por meio do ambiente de rede virtual.

  • Encryption - Os dados armazenados no Redshift podem ser criptografados e configurados ao criar tabelas no Redshift.

  • SSL - A criptografia SSL é usada para criptografar conexões entre clientes e Redshift.

  • Scalable- Com alguns cliques simples, o número de nós pode ser facilmente dimensionado em seu data warehouse Redshift conforme a necessidade. Ele também permite dimensionar a capacidade de armazenamento sem qualquer perda de desempenho.

  • Cost-effective- O Amazon Redshift é uma alternativa econômica às práticas tradicionais de armazenamento de dados. Não há custos iniciais, compromissos de longo prazo e estrutura de preços sob demanda.