Tổng quan về URL
URL là gì? viết tắt của từ gì?
URL là chữ viết tắt của “Uniform Resource Locator“, tạm dịch: “Trình định vị tài nguyên thống nhất“. Đây là một đường dẫn liên kết đến website, tham chiếu tới các tài nguyên trên mạng Internet. Đường dẫn URL là đoạn text có thể đọc được thay cho địa IP mà máy tính sử dụng để liên hệ với server.
Hiểu đơn giản, mỗi website như một ngôi nhà có địa chỉ IP riêng. Địa chỉ IP gồm một dãy số dài, phức tạp và khó nhớ. Để thuận tiện cho người truy cập, địa chỉ IP này được chuyển sang ngôn ngữ mà con người có thể dễ nhớ.
Địa chỉ dạng chữ này được gọi là đường dẫn URL. Nhiệm vụ của URL là sẽ đưa người truy cập đến đúng website cần tìm.
Ví dụ: Địa chỉ website của phimltd https://phim.ltd
Phân loại URL
Hầu hết mọi website đều sẽ có cả 2 loại URL:
URL động (?id=..)
Đây là URL có thể thay đổi. Thông thường, các diễn đàn hoặc website thiết kế mã nguồn mở sẽ dùng URL động. URL động bị đánh giá là không thân thiện với công cụ tìm kiếm.
URL tĩnh (.html)
Đây là URL không thể thay đổi. So với URL động, URL tĩnh được xếp hạng tốt hơn trong công cụ tìm kiếm, được index nhanh hơn.
URL gồm máy phần cơ bản?
Thông thường, một URL sẽ gồm những thành phần cơ bản như sau:
- Giao thức: http, https, FTP…
- World Wide Web: www (có thể không có thường gọi là non-www)
- Tên miền (domain) Ví dụ: phim.ltd
- Cổng giao tiếp (port): 443, 80, 2082, 2222…
Ví dụ đầy đủ 1 đường dẫn URL: https://phim.ltd/watch/c%C6%B0%C6%A1ng-thi-mao-s%C6%A1n-b%E1%BA%A3n-%C4%91%E1%BA%B9p-vietsub-the-first-vampire-in-china_3xmLVrg8Ix1pGmv.html
Đây là ví dụ mô hình đơn giản nhất của một URL.
Scheme (giao thức kết nối) trong URL
Đây là phần mở đầu của URL kết thúc trước dấu ” : “.
Scheme đại diện cho phương thức mà trình duyệt web của bạn dùng để giao tiếp với server. Nhìn vào scheme, bạn sẽ biết được cách thức truyền tải dữ liệu giữa trình duyệt và server. Các loại scheme mà bạn sẽ thường gặp bao gồm:
- Http: xác định các hành động của máy chủ với thao tác của người dùng trên trình duyệt web bằng các lệnh nhất định. Http sẽ sử dụng Port 80 để giao tiếp.
- Https: sử dụng SSL (Secure Socket Layer) để đảm bảo truyền dữ liệu an toàn giữa web server và trình duyệt website. Https sẽ sử dụng port 433 để truyền dữ liệu.
- FTP: chuyển đổi file qua lại giữa trình duyệt và web server.
Thông thường, bạn không nhất thiết phải gõ scheme trước tất cả các URL. Khi bạn gõ phần URL còn lại bất kỳ, ví dụ như tinohost.com thì trình duyệt sẽ tự lựa chọn phương thức phù hợp.
Tuy nhiên, đối với một số URL, bạn sẽ phải tự gõ scheme để lựa chọn phương thức kết nối.
Authority (nhà cung cấp) của URL
Phần này bao gồm tất cả phần còn lại của URL. Authority sẽ được chia thành nhiều phần khác nhau như:
- Tên miền cấp cao nhất (Top-Level Domain): .com, .net, .vn, .us, ….
- Tên miền phụ (Subdomain)
- Thông tin người dùng: Chứa tên người dùng và mật khẩu. Ví dụ: //username:password@www.example.com, trong đó, “username:password” chính là thông tin người dùng, được liên kết với tên máy chủ bằng “@”.
- Số cổng: Thiết bị sử dụng địa chỉ IP để nhận thông tin đến các máy chủ phù hợp ở trên mạng. Ví dụ: “//www.example.com:8080”, trong đó “8080” chính là địa chỉ IP, liên kết với hostname bằng dấu “:”.
Thành phần bổ sung của URL
Có 3 thành phần bổ sung khác dành cho Authority của URL đó là:
Path (đường dẫn)
Đường dẫn này được bắt đầu bằng dấu gạch chéo. Những dấu gạch chéo này sẽ tiếp tục thể hiện phân chia giữa các thư mục và thư mục con (subfolder). Ví dụ như: www.example.com/folder/subfolder/filename.html
Nếu URL đưa bạn đến đúng máy chủ thì Path sẽ đưa bạn đến đúng thư mục hoặc file trên máy chủ đó.
Query (Truy vấn)
Đây là phần thường được hỗ trợ trong tìm kiếm.
Phần truy vấn này được bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn (hoặc sau tên máy chủ nếu không có đường dẫn).
Ví dụ: khi tìm từ “TinoHost” trên Google, ta có: https://www.google.com/search?q=tinohostoq=tinohost+aqs=chrome..69i57j69i60l6.3611j0j1sourceid=chromeie=UTF-8
Trong đó, sau dấu chấm hỏi là 2 phần của truy vấn:
- URL cho tìm kiếm: “search?q=”
- Từ khóa đã được mã hóa: “tinohost…”
Fragment (phân mảnh)
Phân mảnh được bắt đầu bằng một dấu thăng (#) và được sử dụng để xác định vị trí cụ thể của trang web.
URL có ảnh hưởng gì đến website?
Tại sao cần tối ưu hóa URL?
Tối ưu URL sẽ giúp:
- Tăng thứ hạng trên SERPs
- Người dùng nhìn thấy URL của bạn, xác suất nhấp chuột sẽ cao hơn. Tỷ lệ chuyển đổi cao sẽ mang đến doanh thu cao hơn.
- Người dùng có thể nhớ và gõ lại URL nếu muốn quay lại vào lần sau. Trong trường hợp xây dựng backlink, anchor text URL giúp chúng ta xây dựng từ khóa đa dạng rất tốt.
Thế nào là một URL tối ưu?
Người dùng website thường dùng URL để miêu tả một site hay page.
Tiêu chuẩn cần có của một URL là:
- Dẫn về chính xác địa chỉ.
- Ngắn gọn, không được quá dài, viết không dấu.
- Mang tính miêu tả để người dùng dễ dàng nhận biết được page của bạn.
- Không viết có dấu hay nhiều kí tự đặc biệt
- Chứa keyword (từ khóa) để tăng traffic cho web, góp phần nâng cao thứ hạng của website đối với từ khóa trên Google.
- Hạn chế dẫn về thư mục con. Nếu cấu trúc web bao gồm nhiều cấp độ file, thì đường dẫn URL cũng cũng cần phải được thể hiện điều này bằng folder và subfolder.
- Đường dẫn URL tạo khả năng siêu liên kết cho các trang website.
- URL dùng để định vị địa chỉ site trên Internet, có thể là địa chỉ của một website, một webpage, một wap hoặc một bài đăng cụ thể nào đó trên website.
Cách lấy URL của một trang web và cách tối ưu URL
Thao tác lấy URL của trang
Bước 1: Tìm kiếm trang bạn muốn trên Google. Ví dụ: TinoHost
Bước 2: Nhấp vào kết quả tìm kiếm có URL mà bạn cần. Thao tác này sẽ đưa bạn đến trang web.
Bước 3: Trong thanh địa chỉ của trình duyệt ở đầu trang, hãy nhấp một lần để chọn toàn bộ URL.
Bước 4: Nhấp chuột phải vào URL đó sau đó chọn Sao chép.
Bước 5: Dán URL bằng cách nhấp chuột phải vào vị trí cần dán sau đó chọn Dán.
Cách tối ưu URL
Tối ưu nội dung URL
Để phù hợp với thuật toán của Google, URL cần có:
- Từ khóa: nên được đặt ở đầu tiên trong nội dung của một URL.
- Nội dung ngắn gọn, súc tích và mang tính mô tả: để người dùng nhìn vào URL có thể dễ dàng hiểu được nội dung trang web là gì.
- Giới hạn ký tự của URL: 10 từ hoặc là 96 ký tự.
- Stop words: tránh dùng stop words như a, be, in, me, on, of, and hoặc tiếng Việt là cái, là, trong, tôi, trên, của. Đây là những từ “không gây hứng thú” Google và dễ dàng bị bỏ qua một phần hoặc toàn bộ những nội dung có từ này.
Tối ưu cấu trúc URL
Ngoài tối ưu nội dung, tối ưu cấu trúc cũng là việc cần thiết. Chúng ta cần tối ưu những yếu tố sau:
- URL không nên chứa ký tự lạ như _, ^, %, #, . @. ?,… Những ký tự lạ này làm Google không nhận diện được liên kết của web.
- Nên sử dụng URL tĩnh thay vì URL động. URL Friendly là sự kết hợp giữa URL tĩnh và từ khóa mô tả nội dung bài viết. Thực tế, Google thích trang web tĩnh (dạng .html) hơn trang web động (dạng ?id=..).
- Khi Google đã index cấu trúc URL, bạn nên giữ nguyên, không cần thay đổi bất cứ thứ gì nữa. Nếu có lý do bắt buộc phải thay đổi, bạn nên sử dụng redirect 301 để chuyển URL cũ sang mới.
- Đường dẫn URL cần hạn chế nhiều thư mục con: URL không nên đi qua nhiều trang chính mới đến được trang cần SEO. Google không đánh giá cao điều đó. URL tối ưu nên dẫn về đúng bài viết mà không có nhiều thư mục nhỏ.
Chúc bạn tối ưu URL thành công nhé!