统一资源定位符是用于完整地描述Internet上网页和其他资源的地址的一种标识方法。
Internet上的每一个网页都具有一个唯一的名称标识,通常称之为URL地址,这种地址可以是本地磁盘,也可以是局域网上的某一台计算机,更多的是Internet上的站点。简单地说,URL就是Web地址,俗称“网址”。
URI方案集,包含如何访问Internet上的资源的明确指令。
URL是统一的,因为它们采用相同的基本语法,无论寻址哪种特定类型的资源(网页、新闻组)或描述通过哪种机制获取该资源。对于 Internet 服务器或万维网服务器上的目标文件,可以使用"统一资源定位符 (URL)"地址,该地址以"http://"开始。Web 服务器使用"超文本传输协议 (HTTP)“,一种“幕后的”Internet 信息传输协议。
URL由三部分组成:协议类型,主机名和路径及文件名。通过URL可以指定的主要有以下几种:http、ftp、gopher、telnet、file等。
一、包含协议如下:
protocol(协议):指定使用的传输协议,下表列出 protocol 属性的有效方案名称。最常用的是HTTP协议,它也是目前WWW中应用最广的协议。
file资源是本地计算机上的文件。格式file:///
ftp通过 FTP访问资源。格式 FTP://
gopher 通过 Gopher 协议访问该资源
http 通过 HTTP 访问该资源。 格式 HTTP://
https 通过安全的 HTTPS 访问该资源。 格式 HTTPS://
mailto 资源为电子邮件地址,通过 SMTP 访问。 格式 mailto:
MMS 通过 支持MMS(流媒体)协议的播放该资源。(代表软件:Windows Media Player)格式 MMS://
ed2k 通过 支持ed2k(专用下载链接)协议的P2P软件访问该资源。(代表软件:电驴) 格式 ed2k://
Flashget 通过 支持Flashget:(专用下载链接)协议的P2P软件访问该资源。格式 Flashget://
thunder 通过 支持thunder(专用下载链接)协议的P2P软件访问该资源。格式 thunder://
news 通过 NNTP 访问该资源。
tencent 通过支持tencent(专用聊天连接) 协议和用户对话。(代表软件:QQ、TM)格式 tencent://message/?uin=号码&Site=&Menu=yes
msnim 通过支持msnim(专用聊天连接) 协议和用户对话。(代表软件:MSN、WLM) 格式 msnim:chat?contact=邮箱地址
二、hostname(主机名):是指存放资源的服务器的域名系统 (DNS) 主机名或 IP 地址。有时,在主机名前也可以包含连接到服务器所需的用户名和密码(格式:username:password)。
三、port(端口号):整数,可选,省略时使用方案的默认端口,各种传输协议都有默认的端口号,如http的默认端口为80。如果输入时省略,则使用默认端口号。有时候出于安全或其他考虑,可以在服务器上对端口进行重定义,即采用非标准端口号,此时,URL中就不能省略端口号这一项。
四、path(路径):由零或多个“/”符号隔开的字符串,一般用来表示主机上的一个目录或文件地址。
五、?query(查询):可选,用于给动态网页(如使用CGI、ISAPI、PHP/JSP/ASP/ASP.NET等技术制作的网页)传递参数,可有多个参数,用“&”符号隔开,每个参数的名和值用“=”符号隔开。
六、fragment,信息片断,字符串,用于指定网络资源中的片断。例如一个网页中有多个名词解释,可使用fragment直接定位到某一名词解释。
注意,Windows 主机不区分 URL 大小写,但是,Unix/Linux 主机区分大小写。
下面列表是常见的URL中定位和标识的服务或文件:
http:文件在WEB服务器上
file:文件在您自己的局部系统或匿名服务器上
ftp:文件在FTP服务器上
gopher:文件在gopher服务器上
wais:文件在wais服务器上
news:文件在Usenet服务器上
telnet:连接到一个支持Telnet远程登录的服务器上
关于URL结构一般分为两个部分,一个是物理结构,一个是逻辑结构。在物理结构包括扁平结构和树型结构。扁平结构就是网站中所有的页面都是在根目录这一级别,形成一个扁平的物理结构。这比较适合于小型的网站,因为如果太多文件都放在根目录下的话,制作和维护起来比较麻烦。而树型结构的意义是在一级目录下分为多个频道或者称支为目录,然后目录下面再放上属于这个频道的页面,首页、频道首页、频道下的内容就好比树干、树枝、树叶的关系。逻辑结构就是由网页内部链接所形成的逻辑的或链接的网络图。比较好的情况是逻辑结构与前面的树型物理结构相吻合。
主页链接向所有的频道主页;主页一般不直接链接向内容页,除非是你非常想推的几个特殊的页;所有频道主页都连向其他频道主页;频道主页都连回网站主页;频道主页也连向属于自己本身频道的内容页;频道主页一般不连向属于其他频道的内容页;所有内容页都连向网站主页;所有内容页都连向自己的上一级频道主页;内容页可以连向同一个频道的其他内容页;内容页一般不连向其他频道的内容页;内容页在某些情况下,可以用适当的关键词连向其他频道的内容页。
首先,需要注意URL的长度,在URL里最好不要超过3-5个关键词,如果超过5个关键词,该url的权重就会被相应的降低。
其次,在URL中尽量不要出现重复。
最后,切忌在命名的时候用.exe之类的后缀作为URL的结尾。
统一资源定位器(URL)是为了能够使客户端程序查询不同的信息资源时有统一访问方法而定义的一种地址标识方法。在Internet上所有资源都有一个独一无二的URL地址。
通过URL可以到达任何一个地方寻找需要的东西,比如文件、数据库、图像、新闻组等等,可以这样说,URL是Internet上的地址簿。
当信息资源的存放地点发生变化时,必须对URL作相应的改变。因此人们正在研究新的信息资源表示方法,例如:URI (Universal Resource Identifier)即“通用资源标识”(参见RFC 1630)、URN (Uniform Resource Name)即“统一资源名”和URC(Uniform Resource Citation)即“统一资源引用符”等。