Cách khắc phục Báo cáo Trạng thái lập chỉ mục

Sử dụng báo cáo này để tìm hiểu những trang nào của bạn đã được lập chỉ mục và cách khắc phục các trang không thể lập chỉ mục. Mỗi thanh trong biểu đồ thể hiện tổng số URL thuộc một trạng thái cụ thể (hợp lệ, l??

Chia sẻ báo cáo

Bạn có thể chia sẻ chi tiết vấn đề bằng cách nhấp vào nút Chia sẻ trên trang. Liên kết này chỉ cho phép người có liên kết truy cập vào trang hiện tại và bất kỳ trang lịch sử xác nhận nào cho vấn đề này. Liên kết không cấp quyền truy cập vào các trang khác thuộc tài nguyên của bạn hoặc cho phép người dùng được chia sẻ thực hiện bất kỳ hành động nào đối với sản phẩm hay tài khoản của bạn. Bạn có thể thu hồi liên kết bất kỳ lúc nào bằng cách vô hiệu hóa chia sẻ cho trang này.

 

Những điểm cần chú ý

Tốt nhất là bạn nên thấy số trang được lập chỉ mục hợp lệ tăng dần dần khi trang web của bạn phát triển thêm.

  • Nếu bạn thấy số lỗi lập chỉ mục tăng, thì đây có thể là do một thay đổi trong mẫu của bạn gây ra lỗi hoặc có thể bạn đã gửi một sơ đồ trang web bao gồm các URL bị chặn thu thập dữ liệu (ví dụ: bị chặn bởi tệp robots.txt hoặc lệnh noindex hay yêu cầu đăng nhập).
  • Nếu bạn thấy tổng số trang được lập chỉ mục giảm mà không có lỗi tương ứng thì điều này có thể là vì bạn đang chặn truy cập vào các trang hiện tại của mình (thông qua tệp robots.txt, lệnh 'noindex' hoặc yêu cầu xác thực). Nếu đó không phải là vấn đề, hãy xem xét các vấn đề bị loại trừ, sắp xếp theo số trang chịu ảnh hưởng, để xem điều gì có thể gây ra sự sụt giảm này.
  • Nếu bạn có nhiều trang không được lập chỉ mục và bạn nghĩ rằng các trang đó nên nằm trong chỉ mục, hãy xem xét các URL bị loại trừ để tìm thông tin. Bạn có thể đang chặn lập chỉ mục nhiều trang của mình thông qua tệp robots.txt hay lệnh noindex.
Các URL này được phát hiện như thế nào? Google phát hiện URL bằng nhiều phương thức, trong đó các phương thức phổ biến nhất là theo các liên kết từ các trang đã thu thập dữ liệu hoặc qua sơ đồ trang web. Đôi khi những liên kết này không chính xác (và có thể dẫn đến lỗi 404 trên trang web của bạn). Đôi khi trang đó đã từng tồn tại nhưng đã biến mất. Nhưng khi đã biết đến một URL thì Google sẽ tiếp tục cố gắng thu thập dữ liệu URL đó trong một thời gian. Điều này hoàn toàn bình thường. Nếu muốn ngăn chặn điều đó, bạn có thể chặn lập chỉ mục, chặn truy cập hoặc sử dụng chuyển hướng 301 (nếu thích hợp).

Báo cáo cấp cao nhất

Báo cáo cấp cao nhất cho biết trạng thái lập chỉ mục của tất cả các trang mà Google đã cố thu thập dữ liệu trên trang web của bạn, được nhóm theo trạng thái và nguyên nhân.

Trạng thái

Mỗi trang có thể có một trong các cấp trạng thái chung sau đây:

  • Lỗi: Trang chưa được lập chỉ mục. Hãy xem mô tả về loại lỗi cụ thể bên dưới để tìm hiểu thêm và biết cách sửa lỗi. Bạn nên tập trung vào những vấn đề này trước tiên.
  • Cảnh báo: Trang đã được lập chỉ mục, hoặc gần đây vẫn nằm trong chỉ mục, và có một vấn đề bạn nên biết.
  • Bị loại trừ: Trang không nằm trong chỉ mục vì các nguyên nhân mà bạn thường không thể tác động. Trang có thể đang ở giữa quy trình lập chỉ mục hoặc bạn cố tình chặn lập chỉ mục trang (ví dụ như bởi lệnh noindex) và do đó đang hoạt động như dự kiến.
  • Hợp lệ: Trang đã được lập chỉ mục.

Lý do

Mỗi trạng thái (hợp lệ, cảnh báo, lỗi, bị loại trừ) đều có thể có nguyên nhân cụ thể. Dữ liệu trong bảng được nhóm theo nguyên nhân và mỗi hàng có thể mô tả một hoặc nhiều URL. Hãy xem mục Mô tả loại trạng thái dưới đây để biết mô tả về từng loại trạng thái và cách xử lý.

Xác thực

Trạng thái của quy trình xác thực do người dùng khởi tạo cho vấn đề này. Bạn nên ưu tiên các vấn đề chưa được xác thực hoặc bắt đầu.

Bộ lọc thả xuống phát hiện URL

Bộ lọc thả xuống phía trên biểu đồ cho phép bạn lọc kết quả lập chỉ mục theo cơ chế mà qua đó Google đã phát hiện URL. Có sẵn các giá trị sau:

  • Tất cả các trang đã biết [Mặc định] - Hiển thị tất cả các URL mà Google đã phát hiện được bằng bất kỳ phương thức nào.
  • Tất cả các trang đã gửi - Chỉ hiển thị các trang được gửi trong sơ đồ trang web bằng cách sử dụng Search Console, tệp robots.txt hoặc ping sơ đồ trang web).
  • URL cụ thể trong sơ đồ trang web - Chỉ hiển thị các URL được liệt kê trong một sơ đồ trang web cụ thể đã gửi bằng cách sử dụng Search Console. Nếu đó là chỉ mục sơ đồ trang web, tất cả URL trong bất kỳ sơ đồ trang web nào có trong chỉ mục đều được báo cáo.

Một URL được xem là gửi bởi sơ đồ trang web ngay cả khi Google đã phát hiện thấy URL đó bằng cơ chế khác (ví dụ như bằng cách thu thập dữ liệu tự nhiên từ trang khác).

Báo cáo chi tiết theo trạng thái và nguyên nhân

Thao tác nhấp vào một hàng ở trang đầu sẽ hiển thị chi tiết cho một loại trạng thái cụ thể. Báo cáo nguyên nhân chứa các thông tin sau:

  • Biểu đồ hiển thị URL theo trạng thái chung (hợp lệ, lỗi, cảnh báo, bị loại trừ).
  • Bảng hiển thị URL theo loại trạng thái và lần cuối cùng URL đó được thu thập dữ liệu.

Quan trọng: Bạn thấy một URL bị đánh dấu là có vấn đề mà bạn đã khắc phục? Có lẽ bạn đã khắc phục vấn đề SAU lần thu thập dữ liệu cuối cùng của Google. Vì thế, nếu bạn thấy URL có một vấn đề mà bạn đã khắc phục, hãy kiểm tra ngày thu thập dữ liệu cho URL đó:

  • Nếu URL được thu thập lại dữ liệu sau khi bạn sửa lỗi thì chúng tôi đã không thể xác nhận bản sửa lỗi của bạn. Hãy kiểm tra và xác nhận bản sửa lỗi của bạn và chờ Google thu thập lại dữ liệu.
  • Nếu URL đã được thu thập dữ liệu trước khi sửa lỗi, hãy chờ Google thu thập lại dữ liệu trang hoặc nhấp vào "bắt đầu khắc phục" (nếu hiển thị) và khắc phục vấn đề theo quy trình kiểm soát vấn đề.

Khắc phục sự cố các trang của bạn

  1. Xem liệu bạn có thể tìm thấy bất kỳ sự tương ứng nào giữa tổng số lỗi lập chỉ mục hoặc tổng số trang được lập chỉ mục và biểu đồ thu nhỏ cho một lỗi cụ thể hay không để biết được vấn đề nào có thể đang ảnh hưởng đến tổng số lỗi hay tổng số trang được lập chỉ mục của bạn.
  2. Khắc phục vấn đề:
    1. Bảng URL theo mức độ nghiêm trọng và cảnh báo được sắp xếp theo sự kết hợp của mức độ nghiêm trọng, số trang bị ảnh hưởng và liệu trang có đang được xác thực hay không. Bạn nên khắc phục vấn đề theo thứ tự mặc định được hiển thị.
    2. Nếu số lỗi tăng lên, hãy tìm mức tăng tần suất đột biến trong hàng xảy ra đồng thời với mức tăng lỗi trong biểu đồ hàng đầu và nhấp vào hàng để tìm hiểu thêm trong báo cáo chi tiết (được mô tả trong phần tiếp theo).
    3. Nhấp vào một dòng lỗi để truy cập vào trang chi tiết nhằm xem thêm thông tin (xem phần bên dưới). Đọc mô tả về loại lỗi cụ thể để tìm hiểu cách xử lý tốt nhất.
    4. Khắc phục tất cả các trường hợp của mỗi nguyên nhân và yêu cầu xác thực bằng cách nhấp vào Xác thực khắc phục trong trang chi tiết cho nguyên nhân đó. Đọc thêm về xác thực.
    5. Bạn sẽ nhận được thông báo khi quy trình xác thực diễn ra, nhưng bạn có thể kiểm tra lại sau vài ngày để xem liệu số lỗi đã giảm hay chưa.
  3. Bạn cũng nên định kỳ xóa bộ lọc cho URL bị loại trừ, sắp xếp theo số trang bị ảnh hưởng và quét URL để tìm bất kỳ sự cố không mong muốn nào.

Sửa lỗi máy chủ

Lỗi máy chủ nghĩa là Googlebot không thể truy cập URL của bạn, yêu cầu đã hết thời gian chờ hoặc trang web của bạn đang bận. Kết quả là Googlebot bắt buộc phải bỏ qua yêu cầu.

Kiểm tra kết nối máy chủ

Bạn có thể sử dụng công cụ Kiểm tra URL để xem liệu bạn có thể tạo lại lỗi máy chủ trong báo cáo Trạng thái lập chỉ mục hay không.

Sửa lỗi kết nối máy chủ

  • Giảm tải trang quá mức đối với các yêu cầu trang động.
    Một trang web cung cấp cùng một nội dung cho nhiều URL được xem là phân phát nội dung động (ví dụ như www.example.com/shoes.php?color=redsize=7 phân phát cùng một nội dung như www.example.com/shoes.php?size=7color=red).  Các trang động cũng có thể mất nhiều thời gian để phản hồi, dẫn đến các vấn đề hết thời gian chờ. Hoặc máy chủ có thể trả về trạng thái quá tải để yêu cầu Googlebot thu thập dữ liệu trang web chậm hơn. Nói chung, chúng tôi khuyên bạn nên đặt các tham số ngắn và sử dụng chúng một cách thận trọng. Nếu bạn chắc chắn về cách các tham số hoạt động cho trang web của mình, bạn có thể cho Google biết cách chúng tôi nên xử lý những tham số này.
  • Đảm bảo rằng máy chủ lưu trữ của trang web của bạn không bị trục trặc, quá tải hay bị định cấu hình sai cách.
    Nếu vấn đề kết nối, hết thời gian chờ hoặc phản hồi vẫn tiếp diễn, kiểm tra với máy chủ lưu trữ web của bạn và cân nhắc tăng khả năng xử lý lưu lượng truy cập của trang web của bạn.
  • Kiểm tra để đảm bảo bạn không vô tình chặn Google.
    Bạn có thể đang chặn Google do một vấn đề cấp hệ thống, chẳng hạn như vấn đề cấu hình DNS, tường lửa hay hệ thống bảo vệ DoS được định cấu hình không đúng cách hoặc cấu hình hệ thống quản lý nội dung. Hệ thống bảo vệ là một phần quan trọng của lưu trữ an toàn và thường được định cấu hình để tự động chặn các mức cao bất thường của các yêu cầu máy chủ. Tuy nhiên, do Googlebot thường tạo ra nhiều yêu cầu hơn người dùng là con người, Googlebot có thể kích hoạt các hệ thống bảo vệ này, dẫn đến các hệ thống này chặn Googlebot và ngăn Googlebot thu thập dữ liệu trang web của bạn. Để khắc phục các sự cố đó, hãy xác định phần nào của cơ sở hạ tầng của trang web của bạn đang chặn Googlebot và loại bỏ việc chặn. Tường lửa có thể không thuộc quyền kiểm soát của bạn do đó bạn cần thảo luận việc này với nhà cung cấp dịch vụ lưu trữ của mình.
  • Kiểm soát thu thập dữ liệu và lập chỉ mục trang web của công cụ tìm kiếm một cách hợp lý.
    Một số quản trị viên web ngăn Googlebot truy cập trang web của họ một cách có chủ ý, có lẽ họ đang sử dụng tường lửa như được mô tả phía trên. Trong những trường hợp này, mục đích thường không phải là chặn hoàn toàn Googlebot mà là kiểm soát cách trang web được thu thập dữ liệu và lập chỉ mục. Nếu điều này áp dụng với bạn, hãy kiểm tra các điều sau:
    • Để kiểm soát việc Googlebot thu thập dữ liệu nội dung của bạn, hãy sử dụng tệp robots.txt và định cấu hình tham số URL.
    • Nếu bạn lo ngại về các bot xấu sử dụng tác nhân người dùng Googlebot, bạn có thể xác minh xem trình thu thập dữ liệu có thực sự là Googlebot không.
    Nếu bạn muốn thay đổi tần suất Googlebot thu thập dữ liệu trang web của mình, bạn có thể yêu cầu thay đổi về tốc độ thu thập dữ liệu của Googlebot. Nhà cung cấp dịch vụ lưu trữ cũng có thể xác minh quyền sở hữu của các địa chỉ IP của họ.

Sửa lỗi 404

Hầu hết các lỗi 404 không ảnh hưởng đến xếp hạng của trang web của bạn trong Google, vì vậy bạn có thể bỏ qua chúng. Thường chúng bị gây ra bởi lỗi chính tả, định cấu hình trang web sai hoặc bởi nỗ lực gia tăng của Google trong việc phát hiện và thu thập dữ liệu các liên kết trong nội dung nhúng như JavaScript. Dưới đây là một số gợi ý để giúp bạn điều tra và sửa lỗi 404:

  1. Xác định xem có cần phải sửa lỗi không. Nhiều (hầu hết?) lỗi 404 đều không cần sửa. Đây là lý do: Sắp xếp lỗi 404 của bạn theo mức độ ưu tiên và sửa các lỗi cần phải sửa. Bạn có thể bỏ qua những lỗi khác, vì lỗi 404 không ảnh hưởng xấu đến việc lập chỉ mục hay xếp hạng trang web của bạn.
    • Nếu nó là một trang đã bị xóa không có trang thay thế hay trang tương đương, việc trả về mã 404 là phù hợp.
    • Nếu nó là URL không hợp lệ được tạo bởi tập lệnh hoặc URL chưa từng tồn tại trên trang web của bạn, có thể nó không phải là một vấn đề bạn cần lo lắng. Bạn có thể thấy phiền toái khi thấy nó trong báo cáo, nhưng bạn không cần phải sửa nó, trừ khi URL là một liên kết thường bị sai chính tả (xem bên dưới).
  2. Xem các liên kết không hợp lệ nằm ở đâu. Nhấp vào một URL để xem thông tin Được liên kết từ các trang này. Sửa lỗi của bạn sẽ phụ thuộc vào việc liên kết đến từ trang web của bạn hay từ một trang web khác:
    1. Sửa các liên kết từ trang web của bạn đến các trang bị thiếu, hay xóa chúng nếu thích hợp.
      • Nếu nội dung đã di chuyển, hãy thêm chuyển hướng.
      • Nếu bạn đã vĩnh viễn xóa nội dung mà không có ý định thay nội dung đó bằng nội dung liên quan mới hơn, hãy để URL cũ trả về mã 404 hay 410. Google hiện xử lý 410 (Không tồn tại) giống với 404 (Không tìm thấy). Việc trả lại mã khác 404 hoặc 410 cho trang không tồn tại (hoặc chuyển hướng người dùng đến trang khác, chẳng hạn như trang chủ, thay vì trả lại 404) có thể có sự cố. Những trang như vậy được xem là trang soft 404 và có thể gây nhầm lẫn cho cả người dùng và công cụ tìm kiếm.
      • Nếu URL không xác định: Đôi khi bạn có thể thấy lỗi 404 cho các URL chưa từng tồn tại trên trang web của bạn. Các URL không mong muốn này có thể được tạo bởi Googlebot khi cố theo các liên kết tìm được trong JavaScript, tệp Flash hay nội dung được nhúng khác, hoặc có thể chỉ tồn tại trong sơ đồ trang web. Ví dụ: trang web của bạn có thể sử dụng mã như thế này để theo dõi số lượt tải xuống trong Google Analytics:
          Hello World PDF

        Khi Googlebot thấy mã này, nó có thể cố thu thập dữ liệu URL http://www.example.com/download-helloworld, mặc dù đây không phải là một trang có thực. Trong trường hợp này, liên kết có thể xuất hiện dưới dạng lỗi 404 (Not Found) trong báo cáo Lỗi thu thập dữ liệu. Google đang nỗ lực để ngăn chặn loại lỗi thu thập dữ liệu này. Lỗi này không ảnh hưởng đến việc thu thập dữ liệu hay xếp hạng trang web của bạn.

    2. Sửa lỗi liên kết bị sai chính tả từ các trang web khác với chuyển hướng 301. Ví dụ: phiên bản sai chính tả của một URL hợp lệ (www.example.com/redshoos thay cho www.example.com/redshoes) có thể đã xảy ra khi một người nào đó liên kết đến trang web của bạn nhập sai chính tả. Trong trường hợp này, bạn có thể chụp URL bị sai chính tả đó bằng cách tạo chuyển hướng 301 đến URL chính xác. Bạn cũng có thể liên hệ với quản trị viên của trang web kèm theo liên kết không chính xác và yêu cầu họ cập nhật hay xóa liên kết.
  3. Bỏ qua các lỗi còn lại. Không tạo nội dung giả, chuyển hướng đến trang chủ của bạn hay sử dụng robots.txt để chặn các URL này—tất cả những điều này khiến chúng tôi gặp khó khăn hơn trong việc phát hiện cấu trúc trang web của bạn và xử lý nó đúng cách. Chúng tôi gọi những lỗi này là soft 404. Lưu ý rằng việc nhấp vào Vấn đề này đã được khắc phục trong báo cáo Lỗi thu thập dữ liệu chỉ tạm thời ẩn lỗi 404; lỗi sẽ xuất hiện trở lại vào lần tới Google cố thu thập dữ liệu URL đó. (Khi Google đã thu thập dữ liệu một URL thành công, nó có thể cố thu thập dữ liệu URL đó vĩnh viễn. Việc tạo chuyển hướng cấp 300 sẽ trì hoãn lần thu thập dữ liệu lại, có thể trong một khoảng thời gian rất dài.)  Lưu ý rằng việc gửi yêu cầu xóa URL thông qua công cụ xóa URL sẽ không xóa lỗi khỏi báo cáo này.

Nếu bạn không nhận ra một URL trên trang web của mình, bạn có thể bỏ qua nó. Các lỗi này xảy ra khi một người nào đó duyệt tới một URL không tồn tại trên trang web của bạn - có thể họ nhập sai URL vào trình duyệt, hoặc nhập sai URL liên kết. Tuy nhiên, bạn có thể muốn chụp một số URL bị nhập sai này như được mô tả trong danh sách nói trên.

Nguyên nhân của trạng thái

Sau đây là những nguyên nhân có thể cho mỗi trang của bạn.

Đã gửi và chưa gửi

Bất cứ lúc nào bạn thấy kết quả lập chỉ mục có từ "Đã gửi" thì điều đó nghĩa là bạn đã yêu cầu Google lập chỉ mục URL đó một cách rõ ràng bằng cách gửi URL trong sơ đồ trang web.

Lỗi


Các trang có lỗi chưa được lập chỉ mục.


Lỗi máy chủ (5xx): Máy chủ của bạn đã trả về lỗi cấp 500 khi có yêu cầu về trang. Hãy xem phần Sửa lỗi máy chủ.

Lỗi chuyển hướng: URL có lỗi chuyển hướng. Lỗi này có thể thuộc một trong các loại sau: URL là một chuỗi chuyển hướng quá dài; URL là một vòng lặp chuyển hướng; URL chuyển hướng cuối cùng vượt quá độ dài URL tối đa; có URL không hợp lệ hoặc trống trong chuỗi chuyển hướng.

URL đã gửi bị robots.txt chặn: Bạn đã gửi trang này để lập chỉ mục nhưng trang bị robots.txt chặn. Hãy thử kiểm tra trang của bạn bằng trình kiểm tra robots.txt.

URL đã gửi được đánh dấu 'noindex' (ngăn lập chỉ mục): Bạn đã gửi trang này để lập chỉ mục nhưng trang có lệnh 'noindex' trong thẻ meta hoặc phản hồi HTML. Nếu muốn trang này được lập chỉ mục, bạn phải xóa thẻ hoặc tiêu đề HTTP.

URL đã gửi có vẻ là Soft 404: Bạn đã gửi trang này để lập chỉ mục nhưng máy chủ có vẻ đã trả về lỗi soft 404.

URL đã gửi trả về yêu cầu trái phép (401): Bạn đã gửi trang này để lập chỉ mục nhưng Google nhận được phản hồi 401 (trái phép). Hãy xóa yêu cầu ủy quyền cho trang này hoặc cho phép Googlebot truy cập vào các trang của bạn bằng cách xác minh danh tính.

URL đã gửi không tìm thấy (404): Bạn đã gửi một URL không tồn tại để lập chỉ mục. Hãy xem phần Sửa lỗi 404.

URL đã gửi có vấn đề về thu thập dữ liệu: Bạn đã gửi trang này để lập chỉ mục và Google gặp phải lỗi thu thập dữ liệu không xác định không thuộc bất kỳ lý do nào khác. Hãy thử gỡ lỗi trang của bạn bằng công cụ Kiểm tra URL.

Cảnh báo


Các trang có trạng thái cảnh báo có thể yêu cầu sự chú ý của bạn và có thể đã được hoặc chưa được lập chỉ mục, theo kết quả cụ thể.


Đã được lập chỉ mục, mặc dù bị chặn bởi robots.txt: Trang đã được lập chỉ mục mặc dù bị robots.txt chặn (Google luôn tôn trọng robots.txt, nhưng điều này không có ích gì nếu người khác có liên kết đến trang). Vấn đề này được đánh dấu là cảnh báo vì chúng tôi chắc liệu bạn có chủ đích chặn trang khỏi kết quả tìm kiếm hay không. Nếu bạn muốn chặn trang này thì robots.txt không phải là cơ chế thích hợp để ngăn lập chỉ mục . Để ngăn lập chỉ mục, bạn nên sử dụng 'noindex' hoặc chặn truy cập ẩn danh vào trang bằng cách sử dụng quy trình xác thực. Bạn có thể sử dụng trình kiểm tra robots.txt để xác định quy tắc nào đang chặn trang này. Bởi vì tệp robots.txt, bất kỳ đoạn nào được hiển thị cho trang có thể đều sẽ dưới mức tối ưu. Nếu bạn không muốn chặn trang này, hãy cập nhật tệp robots.txt để bỏ chặn trang.

Hợp lệ


Các trang có trạng thái hợp lệ đã được lập chỉ mục.

Đã gửi và lập chỉ mục: Bạn đã gửi URL để lập chỉ mục và trang đã được lập chỉ mục.

Đã lập chỉ mục, chưa được gửi trong sơ đồ trang web: URL đã được Google phát hiện và lập chỉ mục. Chúng tôi khuyên bạn nên gửi tất cả các URL quan trọng bằng cách sử dụng sơ đồ trang web.

Đã lập chỉ mục; xem xét đánh dấu là chuẩn: URL đã được lập chỉ mục. Trang này có các URL trùng lặp, nhưng chúng tôi coi URL này là phiên bản chuẩn. URL không được đánh dấu rõ ràng là trang chuẩn, và vì vậy bạn nên đánh dấu URL này là trang chuẩn một cách rõ ràng .

Bị loại trừ


Các trang này thường không được lập chỉ mục, nhưng chúng tôi nghĩ đó là ý muốn của bạn.


Bị chặn bởi thẻ 'noindex' (ngăn lập chỉ mục): Khi cố gắng lập chỉ mục trang, Google đã gặp phải lệnh 'noindex' và do đó không lập chỉ mục trang. Nếu không muốn trang này được lập chỉ mục thì bạn đã đạt được mục đích của mình. Nếu muốn trang này được lập chỉ mục, bạn nên xóa lệnh 'noindex' đó.

Bị chặn bởi công cụ xóa trang: Trang hiện bị chặn bởi yêu cầu xóa URL. Nếu là chủ sở hữu trang web được xác minh, bạn có thể sử dụng công cụ xóa URL để xem ai đã gửi yêu cầu xóa URL. Yêu cầu xóa chỉ thích hợp trong một khoảng thời gian nhất định (hãy xem tài liệu được liên kết). Sau thời gian đó, Googlebot có thể quay lại và lập chỉ mục trang, ngay cả khi bạn không gửi yêu cầu lập chỉ mục khác. Nếu bạn không muốn Google lập chỉ mục trang, hãy sử dụng 'noindex', yêu cầu ủy quyền cho trang hoặc xóa trang.

Bị chặn bởi robots.txt: Trang này đã bị tệp robots.txt chặn với Googlebot. Bạn có thể xác minh điều này bằng trình kiểm tra robots.txt. Xin lưu ý rằng điều này không có nghĩa là trang sẽ không được lập chỉ mục bằng một số phương thức khác. Nếu có thể tìm thấy thông tin khác về trang này mà không cần tải trang, Google vẫn có thể lập chỉ mục trang (mặc dù điều này ít gặp hơn). Để đảm bảo rằng một trang không được lập chỉ mục bởi Google, hãy xoá quy tắc chặn trong robots.txt và sử dụng lệnh 'noindex'.

Bị chặn do yêu cầu trái phép (401): Trang đã bị chặn với Googlebot do có yêu cầu ủy quyền (phản hồi 401). Nếu bạn muốn Googlebot có thể thu thập dữ liệu trang này, hãy xoá yêu cầu ủy quyền hoặc cho phép Googlebot truy cập vào các trang của bạn.

Thu thập dữ liệu bất thường: Một điều bất thường không xác định đã xảy ra khi tìm nạp URL này. Điều này có thể là mã phản hổi cấp 4xx hoặc 5xx; hãy thử tìm nạp trang bằng cách sử dụng Tìm nạp như Google nhằm xác định xem liệu trang có gặp phải bất kỳ vấn đề tìm nạp nào không. Trang chưa được lập chỉ mục.

Đã thu thập dữ liệu - hiện chưa được lập chỉ mục: Trang đã được Google thu thập dữ liệu nhưng chưa được lập chỉ mục. Trang có thể được hoặc không được lập chỉ mục trong tương lai; bạn không cần phải gửi lại URL này để thu thập dữ liệu.

Đã thu thập dữ liệu - hiện chưa được lập chỉ mục: Trang đã được phát hiện bởi Google nhưng chưa được thu thập dữ liệu. Trường hợp thường gặp là Google đã cố thu thập dữ liệu URL này nhưng trang web đã quá tải; do đó Google phải lên lịch thu thập lại dữ liệu. Đây là lý do tại sao ngày thu thập dữ liệu cuối cùng để trống trên báo cáo.

Trang thay thế có thẻ chuẩn thích hợp: Trang này trùng lặp với một trang mà Google công nhận là trang chuẩn. Trang này trỏ đến trang chuẩn thích hợp, do vậy bạn không cần phải làm gì.

Trang trùng lặp không có thẻ chuẩn: Trang này có các trang trùng lặp nhưng không trang nào trong số đó được đánh dấu là chuẩn. Chúng tôi nghĩ rằng trang này không phải là trang chuẩn. Bạn nên đánh dấu trang chuẩn cho trang này một cách rõ ràng. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

Trang trùng lặp không phải HTML: Một trang không phải HTML (ví dụ: tệp PDF) là bản sao của một trang khác mà Google đã đánh dấu là trang chuẩn. Thường chỉ có URL chuẩn sẽ được hiển thị trong Google Tìm kiếm. Nếu muốn, bạn có thể chỉ định trang chuẩn bằng cách sử dụng tiêu đề HTTP liên kết trong phản hồi.

Google chọn trang chuẩn khác với người dùng: URL này được đánh dấu là trang chuẩn cho một tập hợp trang, nhưng Google nghĩ rằng một URL khác là phiên bản chuẩn thích hợp hơn. Google đã lập chỉ mục trang mà chúng tôi xem là trang chuẩn chứ không phải trang này. Bạn nên đánh dấu trang này là trang trùng lặp của URL chuẩn một cách rõ ràng. Google đã phát hiện thấy trang này mặc dù không có yêu cầu thu thập dữ liệu rõ ràng. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

Không tìm thấy (404): Trang này đã trả về lỗi 404 khi được yêu cầu. Google đã phát hiện thấy URL này mặc dù không có yêu cầu rõ ràng hay sơ đồ trang web nào. Google có thể đã phát hiện thấy URL dưới dạng liên kết từ một trang web khác hoặc có thể trang đã tồn tại trước đó và đã bị xóa. Googlebot có thể sẽ tiếp tục thử thu thập dữ liệu URL này trong một khoảng thời gian. Không có cách nào để yêu cầu Googlebot quên một URL vĩnh viễn, mặc dù Googlebot sẽ thu thập dữ liệu URL đó ít thường xuyên hơn. Các phản hồi 404 không phải là vấn đề nếu do chủ đích. Nếu trang của bạn đã di chuyển, hãy sử dụng chuyển hướng 301 tới vị trí mới. Hãy đọc phần Sửa lỗi 404

Trang bị xóa bởi có khiếu nại pháp lý: Trang đã bị xoá khỏi chỉ mục do khiếu nại pháp lý.

Trang có chuyển hướng: URL là một chuyển hướng và do đó không được thêm vào chỉ mục.

Đã đưa vào hàng đợi thu thập dữ liệu: Trang đang ở trong hàng đợi thu thập dữ liệu; hãy kiểm tra lại sau vài ngày để xem Google đã thu thập dữ liệu trang chưa.

Soft 404: Yêu cầu trang trả về lỗi mà chúng tôi nghĩ là phản hồi soft 404. Điều này có nghĩa là trang trả về thông báo "not found" (không tìm thấy) thân thiện với người dùng mà không kèm theo mã phản hồi 404 tương ứng. Bạn nên trả về mã phản hồi 404 cho các trang "not found" (không tìm thấy) thực sự hoặc thêm thông tin khác vào trang để cho chúng tôi biết rằng đó không phải là mã soft 404. Tìm hiểu thêm

URL đã gửi bị loại bỏ: Bạn đã gửi trang này để lập chỉ mục nhưng trang đã bị loại khỏi chỉ mục vì một lý do không xác định.

URL đã gửi không được chọn là trang chuẩn: URL thuộc một tập hợp các URL trùng lặp mà trong đó không có trang chuẩn được đánh dấu rõ ràng. Bạn đã yêu cầu URL này được lập chỉ mục một cách rõ ràng, nhưng vì URL là trang trùng lặp và Google nghĩ rằng một URL khác là trang chuẩn thích hợp hơn, Google đã không lập chỉ mục URL này. Thay vào đó, chúng tôi đã lập chỉ mục trang chuẩn mà chúng tôi chọn. (Google chỉ lập chỉ mục trang chuẩn trong một nhóm các trang trùng lặp.) Sự khác nhau giữa trạng thái này và "Google chọn trang chuẩn khác với người dùng" là bạn đã yêu cầu lập chỉ mục một cách rõ ràng trong trường hợp này. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

 

Giới thiệu về xác thực

Sau khi khắc phục tất cả các trường hợp của một vấn đề cụ thể trên trang web của mình, bạn có thể yêu cầu Google xác thực các thay đổi. Nếu tất cả các trường hợp đã biết biến mất thì vấn đề sẽ được đánh dấu là đã khắc phục trong bảng trạng thái và đưa xuống cuối bảng. Search Console theo dõi trạng thái xác thực của vấn đề nói chung, cũng như trạng thái của từng trường hợp trong vấn đề đó. Khi tất cả các trường hợp của vấn đề biến mất, vấn đề sẽ được coi là đã khắc phục. (Để biết các trạng thái thực tế được ghi lại, hãy xem Trạng thái xác thực vấn đề và Trạng thái xác thực trường hợp.)

Thông tin khác về thời gian tồn tại của vấn đề...

Thời gian tồn tại của một vấn đề kéo dài từ lần đầu tiên phát hiện thấy bất kỳ trường hợp nào của vấn đề trên trang web của bạn cho đến 90 ngày sau khi trường hợp cuối cùng được đánh dấu là đã biến mất khỏi trang web. Nếu 90 ngày trôi qua mà không có trường hợp lặp lại nào, vấn đề sẽ bị xóa khỏi lịch sử báo cáo.

Ngày phát hiện đầu tiên của vấn đề là ngày đầu tiên phát hiện thấy vấn đề trong suốt thời gian tồn tại này và sẽ không thay đổi. Vì thế:

  • Nếu tất cả các trường hợp của một vấn đề đã được khắc phục, nhưng một trường hợp mới của vấn đề xảy ra 15 ngày sau đó, vấn đề vẫn sẽ được đánh dấu là chưa khắc phục và ngày "phát hiện đầu tiên" vẫn là ngày ban đầu.
  • Nếu vấn đề đó lặp lại sau 91 ngày kể từ khi trường hợp cuối cùng được khắc phục thì lúc này vấn đề trước đó đã được đóng lại. Do đó trường hợp này được ghi lại dưới dạng vấn đề mới, với ngày phát hiện đầu tiên được đặt thành "hôm nay".

Quy trình xác thực cơ bản

Dưới đây là tổng quan về quy trình xác thực sau khi bạn nhấp vào Xác thực khắc phục cho một vấn đề. Quy trình này có thể mất vài ngày và bạn sẽ nhận được thông báo tiến độ qua email.

  1. Khi bạn nhấp vào Xác thực khắc phục, Search Console ngay lập tức kiểm tra một vài trang.
    • Nếu vấn đề hiện tại xảy ra trên bất kỳ trang nào trong số này, quy trình xác thực sẽ kết thúc và trạng thái xác thực vẫn giữ nguyên.
    • Nếu lỗi hiện tại không xảy ra trên các trang mẫu, quy trình xác thực sẽ tiếp tục với trạng thái Đã bắt đầu. Nếu quy trình tìm thấy các vấn đề không liên quan khác, những trường hợp đó được tính riêng với loại vấn đề này và việc xác thực vẫn tiếp tục.
  2. Search Console sẽ xem qua danh sách các URL đã biết bị ảnh hưởng bởi vấn đề này. Chỉ những URL mà trên đó xảy ra các trường hợp đã biết của vấn đề này mới được đưa vào hàng đợi để thu thập lại dữ liệu, không phải toàn bộ trang web. Search Console lưu giữ bản ghi về tất cả các URL đã kiểm tra trong lịch sử xác thực và bạn có thể truy cập vào lịch sử này từ trang chi tiết vấn đề.
  3. Khi một URL được kiểm tra:
    1. Nếu không tìm thấy vấn đề, trạng thái xác thực trường hợp sẽ thay đổi thành Đạt. Nếu đây là trường hợp đầu tiên được kiểm tra sau khi xác thực bắt đầu, trạng thái xác thực vấn đề sẽ thay đổi thành Trông có vẻ ổn.
    2. Nếu URL không thể truy cập được, trạng thái xác thực trường hợp sẽ thay đổi thành Khác (không phải là trạng thái lỗi).
    3. Nếu trường hợp vẫn còn tồn tại, trạng thái vấn đề sẽ thay đổi thành Không đạt và quy trình xác thực kết thúc. Nếu đây là một trang mới được phát hiện qua quá trình thu thập dữ liệu bình thường, trang sẽ được xem là một trường hợp khác của vấn đề hiện tại này.
  4. Khi tất cả các lỗi và URL cảnh báo đã được kiểm tra và số lượng vấn đề là 0, trạng thái của vấn đề sẽ thay đổi thành Đã vượt quaQuan trọng: Ngay cả khi số trang bị ảnh hưởng giảm xuống còn 0 trang và trạng thái vấn đề thay đổi thành Đã vượt qua, nhãn mức độ nghiêm trọng ban đầu sẽ vẫn hiển thị (Lỗi hoặc Cảnh báo).

Ngay cả khi bạn không bao giờ nhấp vào "bắt đầu xác thực" Google vẫn có thể phát hiện thấy các trường hợp đã khắc phục của một vấn đề. Nếu phát hiện thấy tất cả các trường hợp của một vấn đã được khắc phục trong quá trình thu thập dữ liệu thông thường, Google sẽ thay đổi trạng thái vấn đề thành "N/A" (Không áp dụng) trên báo cáo.

Khi nào vấn đề được xem là "đã khắc phục" cho một URL hay một mục?

Vấn đề được đánh dấu là đã khắc phục cho một URL hoặc một mục khi đáp ứng một trong các điều kiện sau:

  • Khi Google thu thập dữ liệu URL và không còn tìm thấy vấn đề trên trang. Đối với lỗi thẻ AMP, điều này có nghĩa là bạn đã khắc phục thẻ hoặc thẻ đã bị xóa (nếu thẻ không bắt buộc). Trong một lần xác thực, URL sẽ được xem là "đã vượt qua."
  • Nếu Google không thể truy cập vào trang vì bất kỳ lý do nào (trang đã bị xóa, bị đánh dấu là noindex (ngăn lập chỉ mục), yêu cầu xác thực, v.v.), vấn đề sẽ được xem là đã khắc phục cho URL đó. Trong một lần xác thực, trang được tính trong trạng thái xác thực "khác".

Xác thực lại

Khi bạn nhấp vào Xác thực lại cho một quy trình xác thực không thành công, quy trình sẽ bắt đầu lại với tất cả các trường hợp không thành công, cộng thêm bất kỳ trường hợp mới nào của vấn đề mà Google phát hiện thấy trong quá trình thu thập dữ liệu thông thường.

Bạn nên đợi chu kỳ xác thực hoàn tất trước khi yêu cầu một chu kỳ khác, ngay cả khi bạn đã khắc phục một số vấn đề trong chu kỳ hiện tại.

Các trường hợp đã vượt qua xác thực (được đánh dấu là Đã vượt qua) hoặc không thể truy cập được nữa (được đánh dấu là Khác) sẽ không được kiểm tra lại và bị xóa khỏi lịch sử khi bạn nhấp vào Xác thực lại.

Lịch sử xác thực

Bạn có thể xem tiến trình của yêu cầu xác thực bằng cách nhấp vào liên kết chi tiết xác thực trong trang chi tiết vấn đề.

Các mục trong lịch sử xác thực được nhóm theo URL cho báo cáo AMP và báo cáo Trạng thái lập chỉ mục. Trong báo cáo Khả năng sử dụng trên thiết bị di động và Kết quả nhiều định dạng, các mục được nhóm theo kết hợp URL + mục dữ liệu có cấu trúc (như được xác định bởi giá trị Tên của mục). Trạng thái xác thực sẽ áp dụng cho vấn đề cụ thể mà bạn đang kiểm tra. Bạn có thể thấy một vấn đề gắn nhãn "Đã vượt qua" trên một trang, nhưng các vấn đề khác lại bị gắn nhãn "Không đạt", "Đang chờ xử lý" hoặc "Khác".

Trạng thái xác thực vấn đề

Các trạng thái xác thực sau đây áp dụng cho một vấn đề nhất định:

  • Chưa bắt đầu: Có một hoặc nhiều trang xảy ra một trường hợp của vấn đề này và bạn chưa hề bắt đầu xác thực các trang đó. Bước tiếp theo:
    1. Nhấp vào vấn đề để tìm hiểu chi tiết lỗi. Hãy kiểm tra các trang riêng lẻ để xem ví dụ về lỗi trên trang trực tuyến bằng cách sử dụng quy trình Kiểm tra AMP. (Nếu quy trình Kiểm tra AMP không hiển thị lỗi trên trang thì đó là vì bạn đã sửa lỗi trên trang trực tuyến sau khi Google tìm thấy lỗi và tạo báo cáo vấn đề này.)
    2. Nhấp vào "Tìm hiểu thêm" trên trang chi tiết để xem chi tiết về quy tắc bị vi phạm.
    3. Nhấp vào dòng URL ví dụ trong bảng để biết chi tiết về lỗi cụ thể đó.
    4. Sửa lỗi các trang của bạn rồi nhấp vào Xác thực khắc phục để Google thu thập lại dữ liệu các trang của bạn. Google sẽ thông báo cho bạn về tiến trình xác thực. Quy trình xác thực mất từ vài ngày đến hai tuần, vì vậy xin hãy kiên nhẫn. 
  • Đã bắt đầu: Bạn đã bắt đầu một nỗ lực xác thực và Google chưa tìm thấy trường hợp còn lại nào của vấn đề. Bước tiếp theo: Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết phải làm gì, nếu cần thiết.
  • Trông có vẻ ổn: Bạn đã bắt đầu một nỗ lực xác thực và tất cả các trường hợp của vấn đề mà Google đã kiểm tra đến giờ đều đã được khắc phục. Bước tiếp theo: Bạn không cần phải làm gì, nhưng Google sẽ gửi thông báo khi quy trình xác thực diễn ra và cho bạn biết điều bạn cần làm.
  • Đã vượt qua: Tất cả các trường hợp đã biết của vấn đề đã biến mất (hoặc URL bị ảnh hưởng không còn có thể truy cập). Bạn hẳn đã nhấp vào "Xác thực khắc phục" để có được trạng thái này (nếu trường hợp biến mất khi bạn chưa yêu cầu xác thực, trạng thái sẽ thay đổi thành N/A). Bước tiếp theo: Bạn không cần phải làm gì khác.
  • N/A: Google nhận thấy rằng vấn đề đã được khắc phục trên tất cả các URL, ngay cả khi bạn chưa hề bắt đầu nỗ lực xác thực. Bước tiếp theo: Bạn không cần phải làm gì khác.
  • Không đạt: Một ngưỡng nhất định của trang vẫn chứa vấn đề này sau khi bạn nhấp vào "Xác thực". Bước tiếp theo: Khắc phục vấn đề và xác thực lại.

Trạng thái xác thực trường hợp

Sau khi có yêu cầu xác thực, mọi trường hợp đã biết đều được chỉ định một trong các trạng thái xác thực sau đây cho một vấn đề cụ thể (trạng thái Đã vượt qua và Khác không được sử dụng trong báo cáo Trạng thái lập chỉ mục):

  • Đang chờ xác thực: Đã đưa vào hàng đợi để xác thực. Trong lần kiểm tra cuối cùng của Google, trường hợp này của vấn đề có tồn tại.
  • Đã vượt qua: Google đã kiểm tra trường hợp của vấn đề và trường hợp không còn tồn tại. Bạn chỉ có thể đạt được trạng thái này nếu đã nhấp vào Xác thực một cách rõ ràng cho trường hợp này.
  • Không đạt: Google đã kiểm tra trường hợp này của vấn đề và trường hợp vẫn tồn tại. Bạn chỉ có thể đạt được trạng thái này nếu đã nhấp vào Xác thực một cách rõ ràng cho trường hợp này.
  • Khác: Google không thể truy cập vào URL có trường hợp hoặc (đối với dữ liệu có cấu trúc) không thể tìm thấy mục trên trang nữa. Được xem là trạng thái tương đương với Đã vượt qua.

Xin lưu ý rằng cùng một URL có thể có trạng thái khác nhau cho các vấn đề khác nhau. Ví dụ: n


Tuấn Nguyễn

587 Blog posts

Comments