Os programadores usam comandos de linguagem para extrair informações específicas de enormes bancos de dados
Leandro Steiw
Traduzível para a língua portuguesa como “consulta”, query é uma palavra em inglês importante nas tarefas de manipulação de bancos de dados. A principal linguagem de consulta de dados, a SQL (Structured Query Language), foi criada em 1970, nos laboratórios da IBM, com base no modelo de dados relacionais — popularmente, tal qual uma planilha de linhas e colunas do Excel.
Queries são comandos que retornam informações armazenadas em um banco de dados.
A funcionalidade da query é pesquisar dados específicos em bancos muitas vezes imensos. As respostas podem ser na forma de tabelas, figuras ou gráficos.
A linguagem de consulta de dados mais difundida em computação é a Structured Query Language (SQL), mas existem também AQL, Datalog e DMX, entre outras. A query também pode ser usada para inserir, selecionar, excluir e atualizar registros no banco de dados.
A query funciona a partir de um código de programação predefinido. Imagine que, toda vez que alguém faz uma pesquisa num mecanismo de busca da internet, há uma série de códigos que transforma a nossa linguagem natural em linguagem de máquina. Só então o computador é capaz de buscar as informações solicitadas.
Os cientistas de dados filtram essas informações diretamente dos bancos de dados ao escreverem comandos na linguagem SQL, por exemplo. A máquina responde com tabelas que relacionam essas informações, similarmente às linhas e às colunas de uma planilha Excel. Em outras linguagens, ele poderia obter um gráfico.
Existem dezenas de comandos de query, alguns dos quais estão listados abaixo:
1) SELECT: Busca dados para removê-los ou atualizá-los no banco posteriormente.
2) WHERE: Funciona junto com o Select, ajudando na filtragem dos dados, pois especifica onde estão as informações que serão pesquisadas.
3) GROUP BY: Organiza os dados na ordem de colunas determinada pelo programador, não necessariamente pela primeira coluna de uma tabela, por exemplo.
4) FIELDBYNAME: Em uma tabela, seleciona os dados de uma única linha especificada pelo programador.
5) PIVOT: Transforma linhas em colunas, que depois podem ser organizadas pelo Group by.
6) ORDER BY: Similarmente ao Group by, organiza os dados conforme a ordem determinada pelo programador.
7) LIMIT: Limita o número de itens que são retornados na pesquisa. Por exemplo, somente as cinco primeiras linhas de uma grande tabela organizada do maior para o menor valor. É um comando importante em enormes bancos de dados.
8) OFFSET: Determina a linha na qual deverá ser iniciada a pesquisa, ou seja, pode-se ignorar os dados das cinco primeiras linhas do exemplo anterior.
9) WHILE: Um comando de loop, ou seja, a pesquisa é repetida enquanto o valor encontrado for verdadeiro.
10) AND, OR, NOT: Operações lógicos que refinam a pesquisa no banco de dados, permitindo a seleção ou exclusão de um ou mais parâmetros. São combinados com outros comandos de query, como alguns dos listados acima.