Quy ước đặt tên file trên Internet và cơ bản về HTTP - FTP

Trong khi đó, FTP (viết tắt từFile Transfer Protocol, giao thức

truyền tải file) là một giao thức dùng đểtải lên (upload) các file từ

một trạm làm việc (workstation) hay máy tính cá nhân tới một FTP

server hoặc tải xuống (download) các file từmột máy chủFTP về

một trạm làm việc (hay máy tính cá nhân). Đây là cách thức đơn giản

nhất đểtruyền tải các file giữa các máy tính trên Internet. Khi tiếp

đầu ngữftp xuất hiện trong một địa chỉURL, có nghĩa rằng người

dùng đang kết nối tới một file server chứkhông phải một Web

server, và một hình thức truyền tải file nào đó sẽđược tiến hành.

Khác với Web server, hầu hết FTP server yêu cầu người dùng phải

đăng nhập (log on) vào server đó đểthực hiện việc truyền tải file.

pdf8 trang | Chia sẻ: maiphuongdc | Lượt xem: 2735 | Lượt tải: 4download
Bạn đang xem nội dung tài liệu Quy ước đặt tên file trên Internet và cơ bản về HTTP - FTP, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Quy ước đặt tên file trên Internet Ðối với những người thiết kế trang Web rồi đưa lên Internet thì điều đầu tiên nên biết là quy ước đặt tên file trên Internet như thế nào, để tránh trường hợp các liên kết bị mất hiệu lực khi chuyển file lên server hay chuyển từ server nầy sang server khác. Lỗi mất liên kết thường xẫy ra nhất khi tạo Website trên máy Windows hay Macintos rồi gởi nó đến server Unix ví Windows và Macintos là 2 hệ điều hành phổ biến nhất cho máy cá nhân còn Unix lại là hệ điều hành phổ biến nhất cho máy server. Có 1 vài quy ước cần phải theo để phù hợp với cả Windows, Macintos và Unix. Ðặt tên file theo quy ước Dos 8.3 An toàn nhất là dùng tên file theo quy ước 8.3 (tên file 8 ký tự, phần mở rộng 3 ký tự) và không dùng ký tự đặt biệt nào trừ dấu gạch dưới (td: image_1.htm). Ðây là tên file được nhận diện bởi mọi hệ điều hành đang có. index.html Tên file chính hay file đầu tiên của Website nên được đặt là index.html vì server Unix đòi hỏi file nầy phải có phần mở rộng là html thay vì htm như các trang khác. Các Server Windows và Macintos cũng chấp nhận tên file như vậy làm file chính. Khi bạn gỏ URL là địa chỉ Website không kèm tên file (td: lhcomputer.8m.com) tất cả các Server sẽ tự động đi tìm trang web chính có tên index.html nạp cho bạn xem. Chử hoa và chử thường Windows và Macintos không quan tâm tới việc phân biệt chử hoa và chử thường trong tên file cũng như trong mã liên kết html. Thí dụ: Bạn đặt tên file là THINGHIEM.HTM, trong mã liên kết bạn lại gỏ là thinghiem.HTM hay ThiNghiem.Htm đều được, chúng vẫn làm việc y như nhau. Khi bạn sao chép file, những file có tên giống nhau nhưng khác chử hoa và chử thường sẽ được coi là cùng 1 file và sẽ đè chồng (thay thế) lên nhau. Nhưng Unix lại phân biệt chính xác chử hoa, chử thường trong tên file và đòi hỏi các liên kết mã html phải chính xác như vậy. Bạn chỉ cần gỏ sai 1 từ thôi thì cả liên kết coi như hỏng. Thí dụ: Bạn đặt tên file là Thinghiem.htm thì bạn phải gỏ mã lịnh liên kết là Thinghiem.htm (không được sai dù chỉ 1 chử T hay t). Khi bạn sao chép file, những file trùng tên nhưng khác các ký tự hoa, thường là những file khác nhau và tồn tại độc lập với nhau. Dấu cách (khoảng trắng) trong tên file Windows và Macintos cho phép trong tên file có khoảng trắng nhưng Unix thì lại không cho phép nên để tương thích nhiều hệ điều hành, bạn nên đặt tên file không có khoảng trắng (thay bằng các dấu gạch dưới để dể phân biệt). Thí dụ: Nên đặt tên file là "thi_nghiem.htm" thay vì "thi nghiem.htm". Tải file Khi dùng các chương trình để tải file lên Internet, bạn cần chú ý là: Có chương trình cho phép bạn chuyển đổi toàn bộ tên file tải lên thành chử thường hay thành chử hoa. Trong quá trình tải file bạn nên chú ý thông báo tên file trong hộp thoại kết quả, nếu thấy tên file hiển thị khác đi thì cần kiểm tra lại tên file gốc và mã liên kết trên ổ đĩa cục bộ. Link Một thói quen tốt nên có khi tạo link là dùng toàn bộ chữ thường trong mã liên kết nội bộ (tương đối). Thí dụ: ../andi/ndc.htm. Và tất cả tên file nên đặt theo kiểu chử thường để dể kiểm tra sửa chữa khi có sai lạc. Liên kết tuyệt đối dùng để nối kết sang các website khác, mã liên kết của nó sẽ bao gồm địa chỉ website (URL) và tên file (hay tên file mặc định là index.html). Thí dụ <A HREF = "" Liên kết tương đối sử dụng khi nối kết các file trong cùng 1 website và việc định địa chỉ link tương đối tùy thuộc vào việc theo dõi thư mục và file ở đâu trong mối tương quan với nhau. Nếu dùng liên kết tương đối cho toàn bộ website, bạn có thể khai thác chúng trên đĩa cứng nội bộ, di chuyển website của bạn qua bất kỳ máy nào hay vật trử tin nào cũng được (các liên kết vẫn có giá trị tiếp tục). Ðể định đường liên kết tương đối bạn cần chú ý 1 số quy ước sau: Tên file chính * Tên file chính mặc định cho một địa chỉ liên kết phổ biến nhất là index.html, do đó khi gỏ địa chỉ liên kết bạn có thể không cần gỏ đầy đủ tên file, trình duyệt web cũng tự động đi tìm file nầy cho bạn. Kỹ thuật nầy bạn nên áp dụng khi đặt tên file chính cho các thư mục khác nếu bạn muốn dùng địa chỉ thư mục nầy như một địa chỉ riêng. Thí dụ: Bạn có thể gỏ lhcomputer.8m.com/phanmem (thay vì lhcomputer.8m.com/phanmem/index.html). Cấu trúc thư mục Nếu web site của bạn có cấu trúc theo kiểu cây thư mục, mục đích cuả link tương đối là cho trình duyệt biết chổ để tìm file đó trong tương quan với trang đang xem. Trong đường dẫn bạn phải hướng trình duyệt lên hay xuống tầng cấu trúc thư mục, cho biết tên file đích cũng như tên của bất kỳ thư mục nào giữa file gốc (đang xem) và file đích. Nếu file gốc nằm ở thu mục con, bạn dùng ../ để biểu thị đường dẫn đến 1 bậc cao hơn (nếu 2 bậc là ../../ và..) Thí dụ theo hình minh họa Nếu bạn đang ở 1 trang trong thư mục "thinh", muốn link đến 1 trang trong thư mục "tienich" bạn chỉ định nối kết như sau: <A HREF = "../../kho/tienich/filename.htm"> (từ "thinh" trở lên 2 thư mục "99" rồi "ctv", vào thư mục "kho" rồi "tienich" rồi tên file đích). Nếu bạn muốn link đến 1 file trong cùng thư mục: <A HREF = "filename.htm"> (không cần di chuyển qua thư mục nào cả). Nếu bạn đang ở thư mục "kho" muốn link đến thư mục "net": <A HREF = "net/filename.htm"> (chỉ đi qua thư mục "net"). Cơ bản về HTTP và FTP Khi gõ địa chỉ một trang Web vào hộp địa chỉ của trình duyệt Web, bạn sẽ thấy xuất hiện một tiếp đầu ngữ là Còn với địa chỉ để tải file trên Internet, bạn phải cầu viện tới cái “biển chỉ đường”ftp://./ Đây chính là hai giao thức (protocol) chủ chốt của hoạt động trao đổi thông tin trên mạng. 1.HTTP là gì ? HTTP là chữ viết tắt từ HyperText Transfer Protocol (giao thức truyền tải siêu văn bản). Nó là giao thức cơ bản mà World Wide Web sử dụng. HTTP xác định cách các thông điệp (các file văn bản, hình ảnh đồ hoạ, âm thanh, video, và các file multimedia khác) được định dạng và truyền tải ra sao, và những hành động nào mà các Web server (máy chủ Web) và các trình duyệt Web (browser) phải làm để đáp ứng các lệnh rất đa dạng. Chẳng hạn, khi bạn gõ một địa chỉ Web URL vào trình duyệt Web, một lệnh HTTP sẽ được gửi tới Web server để ra lệnh và hướng dẫn nó tìm đúng trang Web được yêu cầu và kéo về mở trên trình duyệt Web. Nói nôm na hơn, HTTP là giao thức truyền tải các file từ một Web server vào một trình duyệt Web để người dùng có thể xem một trang Web đang hiện diện trên Internet.HTTP là một giao thức ứng dụng của bộ giao thức TCP/IP (các giao thức nền tảng cho Internet). Có một tiêu chuẩn chính khác cũng điều khiển cách thức World Wide Web làm việc là HTML (HyperText Markup Language, ngôn ngữ đánh dấu siêu văn bản), có chức năng quản lý cách thức mà các trang Web được định dạng và hiển thị. người ta gọi HTTP là một giao thức “phi trạng thái” (stateless) bởi vì mỗi lệnh đều được thực thi một cách độc lập, lệnh sau không biết bất cứ điều gì về các lệnh đã đến trước mình. Đây chính là một hạn chế, khiếm khuyết của HTTP. Nó là nguyên nhân chính của tình trạng rất khó thực thi các trang Web có khả năng phản ứng thông minh đối với lệnh mà người dùng nạp vào. Và sự hạn chế này đang được các nhà phát triển khắc phục trong các công nghệ mới như ActiveX, Java, JavaScript và cookies. Phiên bản mới nhất của HTTP là 1.1. So với phiên bản nguyên thủy (HTTP 1.0), phiên bản mới này truyền tải các trang Web nhanh hơn và giảm tình trạng tắc nghẽn giao thông Web. 2. FTP là gì ? Trong khi đó, FTP (viết tắt từ File Transfer Protocol, giao thức truyền tải file) là một giao thức dùng để tải lên (upload) các file từ một trạm làm việc (workstation) hay máy tính cá nhân tới một FTP server hoặc tải xuống (download) các file từ một máy chủ FTP về một trạm làm việc (hay máy tính cá nhân). Đây là cách thức đơn giản nhất để truyền tải các file giữa các máy tính trên Internet. Khi tiếp đầu ngữ ftp xuất hiện trong một địa chỉ URL, có nghĩa rằng người dùng đang kết nối tới một file server chứ không phải một Web server, và một hình thức truyền tải file nào đó sẽ được tiến hành. Khác với Web server, hầu hết FTP server yêu cầu người dùng phải đăng nhập (log on) vào server đó để thực hiện việc truyền tải file. FTP hiện được dùng phổ biến để upload các trang Web từ nhà thiết kế Web lên một máy chủ host trên Internet, truyền tải các file dữ liệu qua lại giữa các máy tính trên Internet, cũng như để tải các chương trình, các file từ các máy chủ khác về máy tính cá nhân. Dùng giao thức FTP, bạn có thể cập nhật (xóa, đổi tên, di chuyển, copy,) các file tại một máy chủ. Nếu dùng chức năng FTP của một ứng dụng quản lý file (như Total Commander), bạn có thể tiến hành các tác vụ xử lý file trên máy chủ giống như ngay trên máy tính của mình. 3. Sự khác biệt giữa HTTP và FTP? - Với FTP, toàn bộ các file được truyền tải từ thiết bị này tới thiết bị khác và được copy vào bộ nhớ. Còn HTTP chỉ truyền tải nội dung của một trang Web vào một trình duyệt Web để xem. - FTP là một hệ thống hai chiều (two-way system) khi các file được truyền qua lại, tới lui giữa máy chủ và trạm làm việc. Trong khi HTTP là hệ thống một chiều khi các file chỉ được truyền tải từ máy chủ vào trình duyệt Web trên trạm làm việc. - Khi tiếp đầu ngữ http xuất hiện trên một địa chỉ URL, có nghĩa là người dùng đang kết nối tới một Web server chứ không phải là một file server. Các file được truyền tải (transfer) chứ không được tải về (download), vì thế không được copy vào bộ nhớ của thiết bị nhận. TFTP là gì? Là 1 giao thức rất đơn giản để truyền nhận files. Sự đơn giản thể hiện ở ngay cái tên của nó: Trivial File Transfer Protocol (TFTP). Đầu tiên được thiết kế bởi Noel Chiappa, sau đó được nhiều người chỉnh sửa, bổ sung. Nó dùng cơ chế ACK và truyền lại (resending) theo ý tưởng của TCP, cơ chế kiểm lỗi thì dựa trên cơ chế thông điệp trong EFTP của PARC. TFTP đã được hiện thực trên nền tảng của UPD vì vậy nó có thể dùng để di chuyển file trên các máy trên các mạng khác nhau có hiện thực UDP. Nhưng điều này không loại trừ khả năng hiện thực TFTP trên các protocol datagram khác. Nó được thiết kế để hiện thực nhỏ gọn và đơn giản, do đó FTP là giao thức bổ sung các thiếu sót của TFTP. 1 ví dụ về ứng dụng của TFTP: Boot từ xa các host diskless, TFTP dùng để download các file cấu hình cơ bản từ thư mục /boot (lúc này không cần cơ chế nhận dạng). Nếu dùng không cẩn thận, TFTP sẽ cho phép bất cứ ai download bất cứ file gì trên hệ thống của bạn. TFTP (chỉ) có thể: - Đọc và ghi file (hoặc mail) đến/đi từ 1 server từ xa. TFTP không thể: - Liệt kê các thư mục - Chưa có cơ chế nhận dạng user (nên không có bảo vệ bằng password như FTP) Hiện tại có 3 kiểu transfer được hỗ trợ: - Netascii: netascii là mã ASCII được chỉnh sửa theo đặc tả “Telnet Protocol Specification” - đây là ASCII 8 bit - Octet: 8 bit thô - Mail: là các kí tự netascii được gửi đến 1 user chứ không phải 1 file ( kiểu truyền mail này đã cổ xưa và không nên được hiện thực hay dùng) Ngòai ra 2 host có thể thoả thuận với nhau để xác định các kiểu transfer khác TFTP packet TFTP được hiện thực với nền tảng là Datagram Protocol (UDP), mà Datagram Protocol lại được hiện thực trên Internet Protocol, nên các packet của TFTP sẽ có 1 Internt header, 1 Datagram header, và 1 TFTP header. Ngòai ra, các packet có thể có 1 header (LNI, ARPA header…) để cho phép chúng đi qua các phương tiện truyền dẫn trong cục bộ. Thứ tự các nội dung trong 1 packet TFTP: ——————————————————————– | Local Medium | Internet | Datagram | TFTP | ——————————————————————– Giao thức khởi tạo kết nối: - Gửi request: WRQ với yêu cầu ghi lên file, và RRQ với yêu cầu đọc file - Nhận trả lời: 1 ACK packet cho yêu cầu ghi, hay là 1 ACK packet kèm theo 1 packet dữ liệu đầu tiên cho yêu cầu đọc. Trong ACK packet sẽ chứa số block của paket dữ liệu được truyền đi để đọc (block được đánh số tuần tự, bắt đầu từ 1). ACK packet của yêu cầu ghi sẽ có số block = 0. Nếu trả lời là 1 error packet thì yêu cầu bị từ chối. - Để thiết lập kết nối, mỗi terminal xác định 1 TID (Transfer Identifier) để dùng trong suốt quá trình giao tiếp. Đây là các số nguyên được chọn ngẫu nhiên trong khoảng 0 - 65,535. Mỗi packet sẽ quan tâm đến TID của 2 đầu. VD: 1. host A gửi “WRQ” đến host B với source = TID của A, destination = 69 (TID của B) 2. host B gửi “ACK” (với block number = 0) đến A với source = TID của B, destination = TID của A - Sau khi gửi request và nhận trả lời xong, kết nối có thể được thiết lập, host A có thể gửi packet data đầu tiên với block number = 1. Trong các bước tiếp theo, các host sẽ kiểm tra source TID có đúng với giá trị thiết lập ở 1 và 2 không. Nếu không phù hợp, packet sẽ bị từ chối và 1 error packet sẽ được gửi đến source của packet bị sai đó, mà không làm đứt nghẽn kết nối.

Các file đính kèm theo tài liệu này:

  • pdfco_ban_ve_internet_6_6198.pdf
Tài liệu liên quan