Entendendo URL

Cada documento na Web possui um endereço único. Este endereço é conhecido comoUniforme Resource Locator (URL).

Várias tags HTML / XHTML incluem um valor de atributo de URL, incluindo hiperlinks, imagens embutidas e formulários. Todos eles usam a mesma sintaxe para especificar a localização de um recurso da web, independentemente do tipo ou conteúdo desse recurso. É por isso que é conhecido como Localizador Uniforme de Recursos.

Elementos de URL

Um URL é composto por várias partes, cada uma das quais oferece informações ao navegador da web para ajudar a encontrar a página. É mais fácil aprender as partes de um URL, se você observar o exemplo de URL fornecido a seguir, verá que há três partes principais: o esquema, o endereço do host e o caminho do arquivo. A seção a seguir discutirá cada um deles:

http://www.tutorialspoint.com/index.htm

O esquema

O esquema identifica o tipo de protocolo e URL ao qual você está se vinculando e, portanto, como o recurso deve ser recuperado. Por exemplo, a maioria dos navegadores da web usa o protocolo de transferência de hipertexto (HTTP) para passar informações para se comunicar com os servidores da web e esse é o motivo pelo qual um URL começa com http: //.

Existem outros esquemas disponíveis e você pode usar qualquer um deles com base em seus requisitos:

Sr. Não Esquema e descrição
1

http://

O protocolo de transferência de hipertexto (HTTP) é usado para solicitar páginas de servidores da Web e enviá-las de volta dos servidores da Web para os navegadores.

2

https://

O protocolo HTTPS (Secure Hypertext Transfer Protocol) criptografa os dados enviados entre o navegador e o servidor da Web usando um certificado digital.

3

ftp://

O protocolo de transferência de arquivos é outro método de transferência de arquivos na web. Embora o HTTP seja muito mais popular para visualizar sites da Web devido à sua integração com navegadores, o FTP ainda é um protocolo comumente usado para transferir arquivos grandes pela Web e fazer upload de arquivos de origem para o servidor da Web.

4

file://

Usado para indicar que um arquivo está no disco rígido local ou em um diretório compartilhado em uma LAN.

O endereço do host

O endereço do host é onde um site pode ser encontrado, seja o endereço IP (quatro conjuntos de números entre 0 e 255, por exemplo 68.178.157.132) ou, mais comumente, o nome de domínio de um site como www.tutorialspoint.com. Observe que "www" não faz parte do nome de domínio, embora seja freqüentemente usado no endereço do host.

O caminho do arquivo

O caminho do arquivo sempre começa com uma barra e pode consistir em um ou mais nomes de diretório ou pasta. Cada nome de diretório é separado por barras e o caminho do arquivo pode terminar com um nome de arquivo no final. Aqui index.htm é o nome do arquivo que está disponível no diretório html:

https://www.tutorialspoint.com/html/index.htm

Outras partes do URL

Usar credenciais é uma forma de especificar um nome de usuário e senha para uma parte protegida por senha de um site. As credenciais vêm antes do endereço do host e são separadas do endereço do host por um sinal @. Observe como o nome de usuário é separado da senha por dois pontos. O seguinte URL mostra o nome de usuário admin e a senha admin123 :

https://admin:[email protected]/admin/index.htm

Usando o URL acima, você pode autenticar o administrador e, se o ID e a senha fornecidos estiverem corretos, o administrador terá acesso ao arquivo index.htm disponível no diretório admin.

Você pode usar um URL telnet para se conectar a um servidor da seguinte maneira:

telnet://user:[email protected]:port/

Outra informação importante é o número da porta do servidor web . Por padrão, o servidor HTTP é executado na porta número 80. Mas se você estiver executando um servidor em qualquer outro número de porta, ele pode ser fornecido da seguinte forma, presumindo que o servidor esteja executando na porta 8080:

https://www.tutorialspoint.com:8080/index.htm

Os identificadores de fragmento podem ser usados ​​após um nome de arquivo para indicar uma parte específica da página que um navegador deve acessar imediatamente. A seguir está um exemplo para chegar ao topo da página html_text_links.htm.

https://www.tutorialspoint.com/html/html_text_links.htm#top

Você pode passar algumas informações para o servidor usando URL. Quando você usa um formulário em uma página da web, como um formulário de pesquisa ou um formulário de pedido online, o navegador pode anexar as informações que você fornece ao URL para passar informações do seu navegador para o servidor da seguinte maneira -

https://www.tutorialspoint.com/cgi-bin/search.cgi?searchTerm=HTML

Aqui, searchTerm=HTML é passado para o servidor onde o script search.cgi é usado para analisar essas informações passadas e tomar outras providências.

URLs absolutos e relativos

Você pode endereçar um URL de uma das seguintes maneiras:

  • Absolute - Um URL absoluto é o endereço completo de um recurso. Por exemplo http://www.tutorialspoint.com/html/html_text_links.htm

  • Relative - Um URL relativo indica onde o recurso está em relação à página atual. O URL fornecido é adicionado com o elemento <base> para formar um URL completo. Por exemplo /html/html_text_links.htm

Caracteres reservados e inseguros

Os caracteres reservados são aqueles que têm um significado específico no URL. Por exemplo, o caractere de barra separa os elementos de um nome de caminho em um URL. Se você precisar incluir uma barra em um URL que não se destina a ser um separador de elemento, você precisa codificá-lo como% 2F:

Caracteres inseguros são aqueles que não têm nenhum significado especial no URL, mas podem ter um significado especial no contexto em que o URL é escrito. Por exemplo, aspas duplas ("") delimitam valores de atributos de URL nas tags. Se você precisar incluir aspas duplas diretamente em um URL, provavelmente confundirá o navegador. Em vez disso, você deve codificar as aspas duplas para evitar qualquer possível conflito.

Você pode checar HTML URL Encoding tutorial para entender esta codificação, caracteres reservados e não seguros.