Trong khi đó, FTP (viết tắt từFile Transfer Protocol, giao thức
truyền tải file) là một giao thức dùng đểtải lên (upload) các file từ
một trạm làm việc (workstation) hay máy tính cá nhân tới một FTP
server hoặc tải xuống (download) các file từmột máy chủFTP về
một trạm làm việc (hay máy tính cá nhân). Đây là cách thức đơn giản
nhất đểtruyền tải các file giữa các máy tính trên Internet. Khi tiếp
đầu ngữftp xuất hiện trong một địa chỉURL, có nghĩa rằng người
dùng đang kết nối tới một file server chứkhông phải một Web
server, và một hình thức truyền tải file nào đó sẽđược tiến hành.
Khác với Web server, hầu hết FTP server yêu cầu người dùng phải
đăng nhập (log on) vào server đó đểthực hiện việc truyền tải file.
8 trang |
Chia sẻ: maiphuongdc | Lượt xem: 2753 | Lượt tải: 4
Bạn đang xem nội dung tài liệu Quy ước đặt tên file trên Internet và cơ bản về HTTP - FTP, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Quy ước đặt tên file trên Internet
Ðối với những người thiết kế trang Web rồi đưa lên Internet thì điều
đầu tiên nên biết là quy ước đặt tên file trên Internet như thế nào, để tránh
trường hợp các liên kết bị mất hiệu lực khi chuyển file lên server hay
chuyển từ server nầy sang server khác.
Lỗi mất liên kết thường xẫy ra nhất khi tạo Website trên máy Windows
hay Macintos rồi gởi nó đến server Unix ví Windows và Macintos là 2 hệ
điều hành phổ biến nhất cho máy cá nhân còn Unix lại là hệ điều hành
phổ biến nhất cho máy server.
Có 1 vài quy ước cần phải theo để phù hợp với cả Windows, Macintos
và Unix.
Ðặt tên file theo quy ước Dos 8.3
An toàn nhất là dùng tên file theo quy ước 8.3 (tên file 8 ký tự, phần
mở rộng 3 ký tự) và không dùng ký tự đặt biệt nào trừ dấu gạch dưới (td:
image_1.htm). Ðây là tên file được nhận diện bởi mọi hệ điều hành đang
có.
index.html
Tên file chính hay file đầu tiên của Website nên được đặt là
index.html vì server Unix đòi hỏi file nầy phải có phần mở rộng là html
thay vì htm như các trang khác. Các Server Windows và Macintos cũng
chấp nhận tên file như vậy làm file chính.
Khi bạn gỏ URL là địa chỉ Website không kèm tên file (td:
lhcomputer.8m.com) tất cả các Server sẽ tự động đi tìm trang web chính
có tên index.html nạp cho bạn xem.
Chử hoa và chử thường
Windows và Macintos không quan tâm tới việc phân biệt chử hoa và
chử thường trong tên file cũng như trong mã liên kết html. Thí dụ:
Bạn đặt tên file là THINGHIEM.HTM, trong mã liên kết bạn lại gỏ là
thinghiem.HTM hay ThiNghiem.Htm đều được, chúng vẫn làm việc y
như nhau.
Khi bạn sao chép file, những file có tên giống nhau nhưng khác chử
hoa và chử thường sẽ được coi là cùng 1 file và sẽ đè chồng (thay thế) lên
nhau.
Nhưng Unix lại phân biệt chính xác chử hoa, chử thường trong tên file
và đòi hỏi các liên kết mã html phải chính xác như vậy. Bạn chỉ cần gỏ
sai 1 từ thôi thì cả liên kết coi như hỏng. Thí dụ:
Bạn đặt tên file là Thinghiem.htm thì bạn phải gỏ mã lịnh liên kết là
Thinghiem.htm (không được sai dù chỉ 1 chử T hay t).
Khi bạn sao chép file, những file trùng tên nhưng khác các ký tự hoa,
thường là những file khác nhau và tồn tại độc lập với nhau.
Dấu cách (khoảng trắng) trong tên file
Windows và Macintos cho phép trong tên file có khoảng trắng nhưng
Unix thì lại không cho phép nên để tương thích nhiều hệ điều hành, bạn
nên đặt tên file không có khoảng trắng (thay bằng các dấu gạch dưới để
dể phân biệt). Thí dụ: Nên đặt tên file là "thi_nghiem.htm" thay vì "thi
nghiem.htm".
Tải file
Khi dùng các chương trình để tải file lên Internet, bạn cần chú ý là: Có
chương trình cho phép bạn chuyển đổi toàn bộ tên file tải lên thành chử
thường hay thành chử hoa. Trong quá trình tải file bạn nên chú ý thông
báo tên file trong hộp thoại kết quả, nếu thấy tên file hiển thị khác đi thì
cần kiểm tra lại tên file gốc và mã liên kết trên ổ đĩa cục bộ.
Link
Một thói quen tốt nên có khi tạo link là dùng toàn bộ chữ thường trong
mã liên kết nội bộ (tương đối). Thí dụ: ../andi/ndc.htm. Và tất cả tên file
nên đặt theo kiểu chử thường để dể kiểm tra sửa chữa khi có sai lạc.
Liên kết tuyệt đối dùng để nối kết sang các website khác, mã liên kết
của nó sẽ bao gồm địa chỉ website (URL) và tên file (hay tên file mặc
định là index.html). Thí dụ <A HREF =
""
Liên kết tương đối sử dụng khi nối kết các file trong cùng 1 website và
việc định địa chỉ link tương đối tùy thuộc vào việc theo dõi thư mục và
file ở đâu trong mối tương quan với nhau. Nếu dùng liên kết tương đối
cho toàn bộ website, bạn có thể khai thác chúng trên đĩa cứng nội bộ, di
chuyển website của bạn qua bất kỳ máy nào hay vật trử tin nào cũng được
(các liên kết vẫn có giá trị tiếp tục). Ðể định đường liên kết tương đối bạn
cần chú ý 1 số quy ước sau:
Tên file chính
* Tên file chính mặc định cho một địa chỉ liên kết phổ
biến nhất là index.html, do đó khi gỏ địa chỉ liên kết bạn
có thể không cần gỏ đầy đủ tên file, trình duyệt web cũng
tự động đi tìm file nầy cho bạn. Kỹ thuật nầy bạn nên áp
dụng khi đặt tên file chính cho các thư mục khác nếu bạn
muốn dùng địa chỉ thư mục nầy như một địa chỉ riêng. Thí
dụ: Bạn có thể gỏ lhcomputer.8m.com/phanmem (thay vì
lhcomputer.8m.com/phanmem/index.html).
Cấu trúc thư mục
Nếu web site của bạn có cấu trúc theo kiểu cây thư mục,
mục đích cuả link tương đối là cho trình duyệt biết chổ để
tìm file đó trong tương quan với trang đang xem. Trong đường dẫn bạn
phải hướng trình duyệt lên hay xuống tầng cấu trúc thư mục, cho biết tên
file đích cũng như tên của bất kỳ thư mục nào giữa file gốc (đang xem) và
file đích. Nếu file gốc nằm ở thu mục con, bạn dùng ../ để biểu thị đường
dẫn đến 1 bậc cao hơn (nếu 2 bậc là ../../ và..)
Thí dụ theo hình minh họa
Nếu bạn đang ở 1 trang trong thư mục "thinh", muốn link đến 1 trang
trong thư mục "tienich" bạn chỉ định nối kết như sau: <A HREF =
"../../kho/tienich/filename.htm"> (từ "thinh" trở lên 2 thư mục "99" rồi
"ctv", vào thư mục "kho" rồi "tienich" rồi tên file đích).
Nếu bạn muốn link đến 1 file trong cùng thư mục: <A HREF =
"filename.htm"> (không cần di chuyển qua thư mục nào cả).
Nếu bạn đang ở thư mục "kho" muốn link đến thư mục "net": <A
HREF = "net/filename.htm"> (chỉ đi qua thư mục "net").
Cơ bản về HTTP và FTP
Khi gõ địa chỉ một trang Web vào hộp địa chỉ của trình duyệt Web,
bạn sẽ thấy xuất hiện một tiếp đầu ngữ là Còn với địa chỉ để
tải file trên Internet, bạn phải cầu viện tới cái “biển chỉ đường”ftp://./
Đây chính là hai giao thức (protocol) chủ chốt của hoạt động trao đổi
thông tin trên mạng.
1.HTTP là gì ?
HTTP là chữ viết tắt từ HyperText Transfer Protocol (giao thức
truyền tải siêu văn bản). Nó là giao thức cơ bản mà World Wide Web
sử dụng. HTTP xác định cách các thông điệp (các file văn bản, hình
ảnh đồ hoạ, âm thanh, video, và các file multimedia khác) được định
dạng và truyền tải ra sao, và những hành động nào mà các Web
server (máy chủ Web) và các trình duyệt Web (browser) phải làm để
đáp ứng các lệnh rất đa dạng. Chẳng hạn, khi bạn gõ một địa chỉ
Web URL vào trình duyệt Web, một lệnh HTTP sẽ được gửi tới Web
server để ra lệnh và hướng dẫn nó tìm đúng trang Web được yêu cầu
và kéo về mở trên trình duyệt Web. Nói nôm na hơn, HTTP là giao
thức truyền tải các file từ một Web server vào một trình duyệt Web
để người dùng có thể xem một trang Web đang hiện diện trên
Internet.HTTP là một giao thức ứng dụng của bộ giao thức TCP/IP
(các giao thức nền tảng cho Internet).
Có một tiêu chuẩn chính khác cũng điều khiển cách thức World
Wide Web làm việc là HTML (HyperText Markup Language, ngôn
ngữ đánh dấu siêu văn bản), có chức năng quản lý cách thức mà các
trang Web được định dạng và hiển thị.
người ta gọi HTTP là một giao thức “phi trạng thái” (stateless) bởi vì
mỗi lệnh đều được thực thi một cách độc lập, lệnh sau không biết bất
cứ điều gì về các lệnh đã đến trước mình. Đây chính là một hạn chế,
khiếm khuyết của HTTP. Nó là nguyên nhân chính của tình trạng rất
khó thực thi các trang Web có khả năng phản ứng thông minh đối
với lệnh mà người dùng nạp vào. Và sự hạn chế này đang được các
nhà phát triển khắc phục trong các công nghệ mới như ActiveX,
Java, JavaScript và cookies.
Phiên bản mới nhất của HTTP là 1.1. So với phiên bản nguyên thủy
(HTTP 1.0), phiên bản mới này truyền tải các trang Web nhanh hơn
và giảm tình trạng tắc nghẽn giao thông Web.
2. FTP là gì ?
Trong khi đó, FTP (viết tắt từ File Transfer Protocol, giao thức
truyền tải file) là một giao thức dùng để tải lên (upload) các file từ
một trạm làm việc (workstation) hay máy tính cá nhân tới một FTP
server hoặc tải xuống (download) các file từ một máy chủ FTP về
một trạm làm việc (hay máy tính cá nhân). Đây là cách thức đơn giản
nhất để truyền tải các file giữa các máy tính trên Internet. Khi tiếp
đầu ngữ ftp xuất hiện trong một địa chỉ URL, có nghĩa rằng người
dùng đang kết nối tới một file server chứ không phải một Web
server, và một hình thức truyền tải file nào đó sẽ được tiến hành.
Khác với Web server, hầu hết FTP server yêu cầu người dùng phải
đăng nhập (log on) vào server đó để thực hiện việc truyền tải file.
FTP hiện được dùng phổ biến để upload các trang Web từ nhà thiết
kế Web lên một máy chủ host trên Internet, truyền tải các file dữ liệu
qua lại giữa các máy tính trên Internet, cũng như để tải các chương
trình, các file từ các máy chủ khác về máy tính cá nhân. Dùng giao
thức FTP, bạn có thể cập nhật (xóa, đổi tên, di chuyển, copy,) các file
tại một máy chủ. Nếu dùng chức năng FTP của một ứng dụng quản
lý file (như Total Commander), bạn có thể tiến hành các tác vụ xử lý
file trên máy chủ giống như ngay trên máy tính của mình.
3. Sự khác biệt giữa HTTP và FTP?
- Với FTP, toàn bộ các file được truyền tải từ thiết bị này tới thiết bị
khác và được copy vào bộ nhớ. Còn HTTP chỉ truyền tải nội dung
của một trang Web vào một trình duyệt Web để xem.
- FTP là một hệ thống hai chiều (two-way system) khi các file được
truyền qua lại, tới lui giữa máy chủ và trạm làm việc. Trong khi
HTTP là hệ thống một chiều khi các file chỉ được truyền tải từ máy
chủ vào trình duyệt Web trên trạm làm việc.
- Khi tiếp đầu ngữ http xuất hiện trên một địa chỉ URL, có nghĩa là
người dùng đang kết nối tới một Web server chứ không phải là một
file server. Các file được truyền tải (transfer) chứ không được tải về
(download), vì thế không được copy vào bộ nhớ của thiết bị nhận.
TFTP là gì?
Là 1 giao thức rất đơn giản để truyền nhận files. Sự đơn giản thể
hiện ở ngay cái tên của nó: Trivial File Transfer Protocol (TFTP).
Đầu tiên được thiết kế bởi Noel Chiappa, sau đó được nhiều người
chỉnh sửa, bổ sung. Nó dùng cơ chế ACK và truyền lại (resending)
theo ý tưởng của TCP, cơ chế kiểm lỗi thì dựa trên cơ chế thông điệp
trong EFTP của PARC. TFTP đã được hiện thực trên nền tảng của
UPD vì vậy nó có thể dùng để di chuyển file trên các máy trên các
mạng khác nhau có hiện thực UDP. Nhưng điều này không loại trừ
khả năng hiện thực TFTP trên các protocol datagram khác. Nó được
thiết kế để hiện thực nhỏ gọn và đơn giản, do đó FTP là giao thức bổ
sung các thiếu sót của TFTP.
1 ví dụ về ứng dụng của TFTP: Boot từ xa các host diskless, TFTP
dùng để download các file cấu hình cơ bản từ thư mục /boot (lúc này
không cần cơ chế nhận dạng).
Nếu dùng không cẩn thận, TFTP sẽ cho phép bất cứ ai download bất
cứ file gì trên hệ thống của bạn.
TFTP (chỉ) có thể:
- Đọc và ghi file (hoặc mail) đến/đi từ 1 server từ xa.
TFTP không thể:
- Liệt kê các thư mục
- Chưa có cơ chế nhận dạng user (nên không có bảo vệ bằng
password như FTP)
Hiện tại có 3 kiểu transfer được hỗ trợ:
- Netascii: netascii là mã ASCII được chỉnh sửa theo đặc tả “Telnet
Protocol Specification” - đây là ASCII 8 bit
- Octet: 8 bit thô
- Mail: là các kí tự netascii được gửi đến 1 user chứ không phải 1 file
( kiểu truyền mail này đã cổ xưa và không nên được hiện thực hay
dùng)
Ngòai ra 2 host có thể thoả thuận với nhau để xác định các kiểu
transfer khác
TFTP packet
TFTP được hiện thực với nền tảng là Datagram Protocol (UDP), mà
Datagram Protocol lại được hiện thực trên Internet Protocol, nên các
packet của TFTP sẽ có 1 Internt header, 1 Datagram header, và 1
TFTP header. Ngòai ra, các packet có thể có 1 header (LNI, ARPA
header…) để cho phép chúng đi qua các phương tiện truyền dẫn
trong cục bộ. Thứ tự các nội dung trong 1 packet TFTP:
———————————————— ——————–
| Local Medium | Internet | Datagram | TFTP |
———————————————— ——————–
Giao thức khởi tạo kết nối:
- Gửi request: WRQ với yêu cầu ghi lên file, và RRQ với yêu cầu đọc
file
- Nhận trả lời: 1 ACK packet cho yêu cầu ghi, hay là 1 ACK packet
kèm theo 1 packet dữ liệu đầu tiên cho yêu cầu đọc. Trong ACK
packet sẽ chứa số block của paket dữ liệu được truyền đi để đọc
(block được đánh số tuần tự, bắt đầu từ 1). ACK packet của yêu cầu
ghi sẽ có số block = 0. Nếu trả lời là 1 error packet thì yêu cầu bị từ
chối.
- Để thiết lập kết nối, mỗi terminal xác định 1 TID (Transfer
Identifier) để dùng trong suốt quá trình giao tiếp. Đây là các số
nguyên được chọn ngẫu nhiên trong khoảng 0 - 65,535. Mỗi packet sẽ
quan tâm đến TID của 2 đầu.
VD: 1. host A gửi “WRQ” đến host B với source = TID của A,
destination = 69 (TID của B)
2. host B gửi “ACK” (với block number = 0) đến A với source = TID
của B, destination = TID của A
- Sau khi gửi request và nhận trả lời xong, kết nối có thể được thiết
lập, host A có thể gửi packet data đầu tiên với block number = 1.
Trong các bước tiếp theo, các host sẽ kiểm tra source TID có đúng
với giá trị thiết lập ở 1 và 2 không. Nếu không phù hợp, packet sẽ bị
từ chối và 1 error packet sẽ được gửi đến source của packet bị sai đó,
mà không làm đứt nghẽn kết nối.
Các file đính kèm theo tài liệu này:
- co_ban_ve_internet_6_6198.pdf