Entendendo URL
Cada documento na Web possui um endereço único. Este endereço é conhecido comoUniforme Resource Locator (URL).
Várias tags HTML / XHTML incluem um valor de atributo de URL, incluindo hiperlinks, imagens embutidas e formulários. Todos eles usam a mesma sintaxe para especificar a localização de um recurso da web, independentemente do tipo ou conteúdo desse recurso. É por isso que é conhecido como Localizador Uniforme de Recursos.
Elementos de URL
Um URL é composto por várias partes, cada uma das quais oferece informações ao navegador da web para ajudar a encontrar a página. É mais fácil aprender as partes de um URL, se você observar o exemplo de URL fornecido a seguir, verá que há três partes principais: o esquema, o endereço do host e o caminho do arquivo. A seção a seguir discutirá cada um deles:
http://www.tutorialspoint.com/index.htm
O esquema
O esquema identifica o tipo de protocolo e URL ao qual você está se vinculando e, portanto, como o recurso deve ser recuperado. Por exemplo, a maioria dos navegadores da web usa o protocolo de transferência de hipertexto (HTTP) para passar informações para se comunicar com os servidores da web e esse é o motivo pelo qual um URL começa com http: //.
Existem outros esquemas disponíveis e você pode usar qualquer um deles com base em seus requisitos:
Sr. Não | Esquema e descrição |
---|---|
1 | http:// O protocolo de transferência de hipertexto (HTTP) é usado para solicitar páginas de servidores da Web e enviá-las de volta dos servidores da Web para os navegadores. |
2 | https:// O protocolo HTTPS (Secure Hypertext Transfer Protocol) criptografa os dados enviados entre o navegador e o servidor da Web usando um certificado digital. |
3 | ftp:// O protocolo de transferência de arquivos é outro método de transferência de arquivos na web. Embora o HTTP seja muito mais popular para visualizar sites da Web devido à sua integração com navegadores, o FTP ainda é um protocolo comumente usado para transferir arquivos grandes pela Web e fazer upload de arquivos de origem para o servidor da Web. |
4 | file:// Usado para indicar que um arquivo está no disco rígido local ou em um diretório compartilhado em uma LAN. |
O endereço do host
O endereço do host é onde um site pode ser encontrado, seja o endereço IP (quatro conjuntos de números entre 0 e 255, por exemplo 68.178.157.132) ou, mais comumente, o nome de domínio de um site como www.tutorialspoint.com. Observe que "www" não faz parte do nome de domínio, embora seja freqüentemente usado no endereço do host.
O caminho do arquivo
O caminho do arquivo sempre começa com uma barra e pode consistir em um ou mais nomes de diretório ou pasta. Cada nome de diretório é separado por barras e o caminho do arquivo pode terminar com um nome de arquivo no final. Aqui index.htm é o nome do arquivo que está disponível no diretório html:
https://www.tutorialspoint.com/html/index.htm
Outras partes do URL
Usar credenciais é uma forma de especificar um nome de usuário e senha para uma parte protegida por senha de um site. As credenciais vêm antes do endereço do host e são separadas do endereço do host por um sinal @. Observe como o nome de usuário é separado da senha por dois pontos. O seguinte URL mostra o nome de usuário admin e a senha admin123 :
https://admin:[email protected]/admin/index.htm
Usando o URL acima, você pode autenticar o administrador e, se o ID e a senha fornecidos estiverem corretos, o administrador terá acesso ao arquivo index.htm disponível no diretório admin.
Você pode usar um URL telnet para se conectar a um servidor da seguinte maneira:
telnet://user:[email protected]:port/
Outra informação importante é o número da porta do servidor web . Por padrão, o servidor HTTP é executado na porta número 80. Mas se você estiver executando um servidor em qualquer outro número de porta, ele pode ser fornecido da seguinte forma, presumindo que o servidor esteja executando na porta 8080:
https://www.tutorialspoint.com:8080/index.htm
Os identificadores de fragmento podem ser usados após um nome de arquivo para indicar uma parte específica da página que um navegador deve acessar imediatamente. A seguir está um exemplo para chegar ao topo da página html_text_links.htm.
https://www.tutorialspoint.com/html/html_text_links.htm#top
Você pode passar algumas informações para o servidor usando URL. Quando você usa um formulário em uma página da web, como um formulário de pesquisa ou um formulário de pedido online, o navegador pode anexar as informações que você fornece ao URL para passar informações do seu navegador para o servidor da seguinte maneira -
https://www.tutorialspoint.com/cgi-bin/search.cgi?searchTerm=HTML
Aqui, searchTerm=HTML é passado para o servidor onde o script search.cgi é usado para analisar essas informações passadas e tomar outras providências.
URLs absolutos e relativos
Você pode endereçar um URL de uma das seguintes maneiras:
Absolute - Um URL absoluto é o endereço completo de um recurso. Por exemplo http://www.tutorialspoint.com/html/html_text_links.htm
Relative - Um URL relativo indica onde o recurso está em relação à página atual. O URL fornecido é adicionado com o elemento <base> para formar um URL completo. Por exemplo /html/html_text_links.htm
Caracteres reservados e inseguros
Os caracteres reservados são aqueles que têm um significado específico no URL. Por exemplo, o caractere de barra separa os elementos de um nome de caminho em um URL. Se você precisar incluir uma barra em um URL que não se destina a ser um separador de elemento, você precisa codificá-lo como% 2F:
Caracteres inseguros são aqueles que não têm nenhum significado especial no URL, mas podem ter um significado especial no contexto em que o URL é escrito. Por exemplo, aspas duplas ("") delimitam valores de atributos de URL nas tags. Se você precisar incluir aspas duplas diretamente em um URL, provavelmente confundirá o navegador. Em vez disso, você deve codificar as aspas duplas para evitar qualquer possível conflito.
Você pode checar HTML URL Encoding tutorial para entender esta codificação, caracteres reservados e não seguros.