A World Wide Web seria de fato uma teia emaranhada se não fosse por um sistema bem definido para localizar os vários recursos que os navegadores da web exibem como sites. Endereços da Web - conhecidos como localizadores de recursos uniformes ou URLs - são identificadores estruturados, de várias partes e padronizados que os navegadores da Web usam para especificar como, onde e o que encontrar e recuperar da Web.
Identificação
As partes de um URL compreendem sequências de letras, números e símbolos que obedecem a uma convenção e sintaxe de nomenclatura padronizada. O formato de URL mais familiar para os internautas é "http://www.hostname.com:80/directorypath/file.html". Este formato de URL especifica o protocolo, o nome do domínio, o número da porta e a especificação do recurso. Os dois pontos (:), barras (/) e pontos (.) separam as partes de um URL.
Parte do protocolo
A parte de protocolo de uma URL especifica o esquema de serviço da Internet usado para solicitar e retornar o recurso identificado. HTTP - ou protocolo de transferência de hipertexto - é o protocolo padrão para servidores web. Outros protocolos incluem HTTP seguro (https), protocolo de transferência de arquivos (ftp), protocolo de transferência de notícias de rede (nntp) e protocolo de transferência de correio simples (smtp). Se a parte do protocolo de uma URL não for especificada, os navegadores da Web usarão http como padrão.
Parte do nome de domínio
A parte do nome de domínio de um URL -- www.hostname.com, por exemplo --- é melhor compreendida lendo as subpartes da direita para a esquerda. O tipo de domínio familiar "com" significa "empresa/comercial". Outros tipos de domínio comuns incluem "org" para "organização"; "rede" para "rede"; e "gov" para "governo". Os tipos de domínio específicos do país incluem "jp" para "Japão" e "uk" para "Reino Unido". O "hostname" é um subdomínio do nome de domínio "com" e identifica um determinado servidor de Internet. O "www" identifica o subdomínio da World Wide Web de "hostname.com". Um endereço de protocolo de Internet (IP) numérico explícito pode ser usado como substituto para toda a parte do domínio de um URL. O sistema de nomes de domínio (DNS) da Internet converte nomes de domínio em endereços IP.
Parte do número da porta
A parte do número da porta de uma URL identifica o ponto de extremidade de comunicação específico para protocolos da Internet. Por padrão, a porta 80 é o número da porta usada para o protocolo HTTP na World Wide Web e geralmente não precisa ser especificada em uma URL.
Parte de especificação de recursos
A parte de especificação de recursos de uma URL identifica a localização do recurso solicitado no servidor host no domínio. A especificação do recurso normalmente inclui um ou mais nomes de subdiretório, o nome do recurso e o tipo de recurso. O nome e o tipo do recurso geralmente são um nome de arquivo com um sufixo de extensão que identifica o tipo de arquivo. O sufixo ".htm" ou ".html" identifica o tipo de arquivo de "linguagem de marcação de hipertexto", o tipo de arquivo que fornece a funcionalidade de hiperlink de assinatura de navegação na web. Outro tipo comum de recurso é uma especificação de consulta dinâmica que passa parâmetros de consulta para um serviço no servidor host que retorna os resultados como uma página da Web para o navegador da Web. Os mecanismos de pesquisa da Internet usam esse tipo de URL que pode ser reconhecido pelos pontos de interrogação (?) na parte de especificação de recursos da URL.
Insights de especialistas
O identificador de recurso uniforme (URI) é o termo preferido usado na literatura técnica para se referir à tecnologia padronizada de nomeação e endereçamento da Internet. URI é um termo genérico que inclui URLs, bem como nomes de recursos uniformes (URNs), citações de recursos uniformes (URCs) e outras classes de identificadores de recursos da Internet.