Khi duyệt web, bạn chắc hẳn bạn đã nghe nói đến URL nhưng chính xác thì nó là gì, có cấu trúc như thế nào và thành phần ra sao? Bài viết dưới đây sẽ cung cấp cho bạn cái nhìn tổng quan về URL và cách để tối ưu trong SEO một cách đơn giản nhất.
Tìm hiểu tổng quan về URL
Đường dẫn URL không chỉ được sử dụng phổ biến trong quá trình lướt web hay sử dụng Internet của người dùng mà nó còn là yếu tố rất được quan tâm đến trong SEO. Thậm chí nó còn có ảnh hưởng nhiều tới toàn bộ chiến lược SEO Marketing của doanh nghiệp.
URL là gì?
URL là viết tắt của cụm từ Uniform Resource Locator, dịch sang tiếng Việt nghĩa là định vị tài nguyên thống nhất. Cụ thể, nó là địa chỉ của một tài nguyên duy nhất trên Web.
Mỗi đường dẫn hợp lệ sẽ dẫn đến một tài nguyên duy nhất, tài nguyên đó có thể là trang HTML, tài liệu CSS, video, hình ảnh hay file PDF… Trong một số trường hợp ngoại lệ, nó có thể trỏ đến những tài nguyên không còn tồn tại hoặc đã bị di chuyển sang một địa chỉ khác (moved).
URL có thể chứa nhiều thành phần khác nhau, bao gồm hostname của một tài nguyên cụ thể trên Internet và một loạt những thông tin bổ sung thông báo cho trình duyệt và máy chủ biết cách xử lý mọi thứ.
Bạn có thể nghĩ địa chỉ IP đơn giản như số điện thoại, hostname như tên của người sở hữu số điện thoại đó mà bạn đang muốn tra cứu. Và một tiêu chuẩn được gọi là Hệ thống tên miền hoạt động trong nền giống như một cuốn danh bạ điện thoại, dịch các hostname thành địa chỉ IP để mạng có thể sử dụng để định tuyến lưu lượng truy cập.
Phân loại
Hầu hết mọi website đều sẽ có cả 2 loại đường dẫn này:
URL động (?id=..) : là loại có thể thay đổi, nó thường là các diễn đàn hoặc website thiết kế mã nguồn mở. Tuy nhiên nó không thân thiện với công cụ tìm kiếm và gần như giống nhau.
URL tĩnh (.html) : là loại không thể thay đổi, nó được xếp hạng tốt hơn trong công cụ tìm kiếm và được index nhanh hơn loại động. Nó giúp cho người dùng có thể dễ dàng hiểu được website có ý nghĩa gì. Khi mọi người nhìn thấy một đường dẫn cụ thể và phù hợp với tiêu đề mô tả, khả năng họ nhấp chuột vào tìm hiểu sẽ cao hơn là khi thấy một địa chỉ link không có ý nghĩa gì với họ.
Lịch sử URL
Việc lưu giữ dữ liệu liên quan tới việc sử dụng web đã trở thành một sự quan tâm lớn về quyền riêng tư. Ngày càng có nhiều người dùng yêu cầu nhà cung cấp dịch vụ ứng dụng và công cụ tìm kiếm phải rõ ràng, minh bạch về thông tin họ thu thập, lưu giữ và bán cho bên thứ 3.
Ví dụ, vào tháng 3 năm 2019, Google đã chính thức cập nhật chính sách bảo mật của Chrome. Google lưu ý trong chế độ trình duyệt cơ bản của Chrome, công cụ tìm kiếm lưu trữ thông tin cục bộ trên hệ thống của bạn. Thông tin này bao gồm lịch sử duyệt web, nghĩa là URL của các trang đã từng truy cập, cùng với bộ nhớ của văn bản, hình ảnh và các tài nguyên khác từ những trang đó.
Tuy nhiên, Google cũng thu thập và lưu giữ các dữ liệu trong nhiều khoảng thời gian khác nhau. Một số dữ liệu có thể sẽ bị xóa bất cứ khi nào một người muốn, một số sẽ bị xóa tự động và một số khác được Google giữ lại trong thời gian dài khi cần thiết.
Cấu trúc của URL
Về cơ bản thì đường dẫn được chia làm 2 thành phần chính đó là Scheme (giao thức kết nối) và Authority (nhà cung cấp).
Scheme
Scheme chính là phần mở đầu của URL kết thúc trước dấu ” : “, đại diện cho phương thức mà trình duyệt web dùng để giao tiếp với server. Người dùng thường sẽ ít chú ý phần này, tuy nhiên, scheme sẽ quy định cách thức để truyền tải dữ liệu giữa trình duyệt và server. Các loại scheme mà bạn thường gặp như:
- Http: là viết tắt của cụm từ HyperText Transfer Protocol, tạm dịch chính là giao thức truyền tải siêu văn bản. Đây là giao thức truyền tải cơ bản nhất của trang web và server. Giao thức này sẽ xác định các hành động của máy chủ với thao tác của người dùng trên trình duyệt web bằng một số lệnh nhất định.
- Https: chính là viết tắt của cụm từ HyperText Transfer Protocol Secure. Cũng tương tự như Http, nhưng Https lại có thêm chức năng mã hóa dữ liệu trong quá trình truyền tải. Quá trình này sử dụng SSL để đảm bảo truyền dữ liệu an toàn giữa web server và trình duyệt website.
- FTP: chính là viết tắt của cụm từ File Transfer Protocol. Giao thức này dùng để chuyển đổi file qua lại giữa trình duyệt và trang web server.
Không nhất thiết rằng bạn phải gõ scheme trước trong tất cả các URL. Khi gõ phần còn lại bất kỳ, ví dụ như wiki.matbao.net thì trình duyệt sẽ tự động lựa chọn một phương thức phù hợp. Tuy nhiên đối với một vài đường dẫn, bạn sẽ phải tự gõ scheme để lựa chọn phương thức kết nối.
Authority
Phần Authority của một URL lại được chia thành các phần nhỏ, cụ thể là:
- Top-Level Domain: chính là loại tên miền cấp cao nhất.
- Subdomain: là tên miền phụ.
Đây chính là hai thành phần cơ bản nhất của một URL, những đường dẫn khác có thể phức tạp hơn nhiều. Các thành phần khác có thể có trong phần Authority đó là:
- Thông tin người dùng: Bao gồm tên người dùng và mật khẩu trang web mà bạn đang truy cập.
- Số cổng: thường xuất hiện sau tên máy chủ và trước dấu hai chấm. Thành phần này là để thông báo cho máy tính biết ứng dụng mà lưu lượng truy cập đến đang nhắm tới.
Các thành phần bổ sung
Có ba phần bổ sung của URL mà bạn có thể thấy sau phần Authority đó là đường dẫn, truy vấn và phân mảnh.
Đường dẫn sẽ được bắt đầu bằng dấu gạch chéo và có các dấu gạch chéo giữa các thư mục với thư mục con. Và chức năng của đường dẫn này là đưa bạn đến đúng thư mục hoặc file trên máy chủ. Có thể bạn sẽ không nhìn thấy được đường dẫn này xuất hiện trên thanh địa chỉ, nhưng điều đó không có nghĩa là không có đường dẫn.
Phần truy vấn của một đường dẫn sẽ được bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn hoặc sau tên máy chủ nếu như không có đường dẫn. Phần truy vấn này được sử dụng để máy xác định những thứ không phải là thành phần của cấu trúc đường dẫn cố định.
Phân mảnh được bắt đầu bằng dấu thăng và được sử dụng với mục đích để xác định vị trí cụ thể của từng trang web. Khi sử dụng phân mảnh thích hợp nằm ở cuối URL, trình duyệt của bạn sẽ tải trang và sau đó sẽ chuyển đến liên kết nào đó.
URL có vai trò gì đến website?
URL chính là đường dẫn đến trang web mà người dùng muốn truy cập một cách chính xác. Dưới đây là những lợi ích, tác động của nó đến hoạt động của SEO website doanh nghiệp:
- URL giúp người dùng miêu tả một site hay một page nào đó, tạo nên đường dẫn chính xác, thuyết phục và hấp dẫn, giúp cho web của bạn tạo được ấn tượng tốt và có vị thế tốt hơn trên thị trường trực tuyến.
- Giúp cho website của bạn tăng thứ hạng một cách nhanh chóng.
- Tăng khả năng thuyết phục các khách hàng truy cập vào link bài viết.
- Giúp khách hàng có thể ghi nhớ thương hiệu của doanh nghiệp một cách dễ dàng hơn, từ đó tăng tỷ lệ quay lại vào lần sau của khách hàng.
Cách lấy URL của một trang web và cách để tối ưu URL
Việc tối ưu website chuẩn seo là yếu tố cần thiết giúp cho website của bạn có thể giữ vững vị trí cao trong top từ khóa và thu hút được ngày càng nhiều khách hàng chất lượng và tiềm năng hơn.
Thao tác lấy URL của trang
Dưới đây là các bước để lấy đường liên kết của một trang Web bất kỳ, bạn có thể tham khảo và thực hiện theo:
- Bước 1: Tìm kiếm trang web mà bạn muốn lấy URL trên Google.
- Bước 2: Nhấp vào kết quả tìm kiếm mà bạn cần. Thao tác này sẽ đưa bạn đến trang web đó.
- Bước 3: Trong thanh địa chỉ của trình duyệt ở đầu trang, bạn nhấp một lần để chọn toàn bộ đường liên kết.
- Bước 4: Nhấp chuột phải vào URL và đó sau đó chọn Sao chép.
- Bước 5: Dán link dẫn bằng cách nhấp chuột phải vào vị trí cần dán sau đó chọn Dán là đã hoàn thành.
Cách tối ưu URL
Để phù hợp với thuật toán của Google, URL cần phải có:
- Từ khóa: nên đặt ở đầu tiên trong nội dung của một URL.
- Nội dung ngắn gọn, súc tích, mang tính mô tả: để người dùng có thể nhìn vào và dễ dàng hiểu được nội dung trang web là gì.
- Giới hạn ký tự: 10 từ hoặc tối đa là 96 ký tự.
- Stop words: tránh dùng stop words như be, in, me, on, of, and hoặc tiếng Việt là cái, là, trong, tôi,… Vì đây là những từ “không gây hứng thú”, dễ bị bỏ qua một phần hoặc toàn bộ những nội dung có từ này.
Ngoài việc tối ưu nội dung, tối ưu cấu trúc cũng là điều cần thiết. Chúng ta cần tối ưu những yếu tố sau đây:
- URL không nên chứa các ký tự lạ như _, ^, %, #, &. @. ?,… Những ký tự lạ này sẽ làm Google không nhận diện được liên kết của web.
- Nên sử dụng các URL tĩnh thay vì loại động, URL Friendly chính là sự kết hợp giữa loại tĩnh và từ khóa mô tả nội dung bài viết. Thực tế thì Google thích trang web tĩnh (dạng .html) hơn là trang web động (dạng ?id=..).
- Khi Google đã index cấu trúc URL, tốt nhất bạn nên giữ nguyên, không cần phải thay đổi bất cứ thứ gì nữa. Nhưng nếu có lý do bắt buộc phải thay đổi, bạn hãy sử dụng redirect 301 để chuyển từ cũ sang mới.
- Đường dẫn URL nên hạn chế các thư mục con: Google không hề đánh giá cao điều này, một đường dẫn tối ưu nên dẫn về đúng bài viết mà không có nhiều thư mục nhỏ.
Những câu hỏi thường gặp về URL của người dùng
Với những người mới bắt đầu tìm hiểu và tiếp cận đến URL trong SEO, thường sẽ có nhiều vấn đề thắc mắc. Chúng tôi đã tổng hợp vài câu hỏi được đặt ra nhiều nhất và cũng giúp bạn giải đáp ngay dưới đây.
Độ dài tối ưu của URL là bao nhiêu trong SEO?
Độ dài trung bình của URL cho Gmail là 59 ký tự.
Độ dài trung bình cho Webmaster Tools là 90 ký tự.
Độ dài trung bình cho blog Google là 76 ký tự.
Độ dài tối đa của URL để được hiển thị trên các trình duyệt Chrome, Cốc cốc, Firefox, IE,…: là 2048 ký tự.
URL và Link khác nhau ở điểm nào?
Có nhiều người thường sử dụng thuật ngữ URL và Link để thay thế cho nhau mà không biết hai khái niệm này có những sự khác biệt nhất định:
- Link được sử dụng để đưa người dùng từ địa chỉ này sang một địa chỉ khác, trong khi URL lại là địa chỉ để liên kết đến website.
- Link không hề tuân theo bất kỳ giao thức nào, còn URL sẽ phải tuân theo nhiều giao thức, như http, https, ftp.
- Link không có cú pháp cụ thể, trong khi URL thì có và buộc người dùng phải tuân theo.
Kết luận
Có lẽ qua những thông tin mà chúng tôi đã đưa ra trong bài viết trên đây, bạn đã hiểu rõ được URL là gì và những lợi ích to lớn mà nó mang lại. Đặc biệt là khả năng dẫn người dùng đến với website mà họ mong muốn một cách nhanh chóng, dễ dàng và chính xác.