Chia sẻ báo cáo

Bạn có thể chia sẻ chi tiết vấn đề bằng cách nhấp vào nút Chia sẻ trên trang. Liên kết này chỉ cho phép người có liên kết truy cập vào trang hiện tại và bất kỳ trang lịch sử xác nhận nào cho vấn đề này. Liên kết không cấp quyền truy cập vào các trang khác thuộc tài nguyên của bạn hoặc cho phép người dùng được chia sẻ thực hiện bất kỳ hành động nào đối với sản phẩm hay tài khoản của bạn. Bạn có thể thu hồi liên kết bất kỳ lúc nào bằng cách vô hiệu hóa chia sẻ cho trang này.

 

Tốt nhất là bạn nên thấy số trang được lập chỉ mục hợp lệ tăng dần dần khi trang web của bạn phát triển thêm.

Báo cáo cấp cao nhất cho biết trạng thái lập chỉ mục của tất cả các trang mà Google đã cố thu thập dữ liệu trên trang web của bạn, được nhóm theo trạng thái và nguyên nhân.

Mỗi trang có thể có một trong các cấp trạng thái chung sau đây:

Mỗi trạng thái (hợp lệ, cảnh báo, lỗi, bị loại trừ) đều có thể có nguyên nhân cụ thể. Dữ liệu trong bảng được nhóm theo nguyên nhân và mỗi hàng có thể mô tả một hoặc nhiều URL. Hãy xem mục Mô tả loại trạng thái dưới đây để biết mô tả về từng loại trạng thái và cách xử lý.

Trạng thái của quy trình xác thực do người dùng khởi tạo cho vấn đề này. Bạn nên ưu tiên các vấn đề chưa được xác thực hoặc bắt đầu.

Bộ lọc thả xuống phía trên biểu đồ cho phép bạn lọc kết quả lập chỉ mục theo cơ chế mà qua đó Google đã phát hiện URL. Có sẵn các giá trị sau:

Một URL được xem là gửi bởi sơ đồ trang web ngay cả khi Google đã phát hiện thấy URL đó bằng cơ chế khác (ví dụ như bằng cách thu thập dữ liệu tự nhiên từ trang khác).

Thao tác nhấp vào một hàng ở trang đầu sẽ hiển thị chi tiết cho một loại trạng thái cụ thể. Báo cáo nguyên nhân chứa các thông tin sau:

Quan trọng: Bạn thấy một URL bị đánh dấu là có vấn đề mà bạn đã khắc phục? Có lẽ bạn đã khắc phục vấn đề SAU lần thu thập dữ liệu cuối cùng của Google. Vì thế, nếu bạn thấy URL có một vấn đề mà bạn đã khắc phục, hãy kiểm tra ngày thu thập dữ liệu cho URL đó:

Hầu hết các lỗi 404 không ảnh hưởng đến xếp hạng của trang web của bạn trong Google, vì vậy bạn có thể bỏ qua chúng. Thường chúng bị gây ra bởi lỗi chính tả, định cấu hình trang web sai hoặc bởi nỗ lực gia tăng của Google trong việc phát hiện và thu thập dữ liệu các liên kết trong nội dung nhúng như JavaScript. Dưới đây là một số gợi ý để giúp bạn điều tra và sửa lỗi 404:

  Hello World PDF

Khi Googlebot thấy mã này, nó có thể cố thu thập dữ liệu URL http://www.example.com/download-helloworld, mặc dù đây không phải là một trang có thực. Trong trường hợp này, liên kết có thể xuất hiện dưới dạng lỗi 404 (Not Found) trong báo cáo Lỗi thu thập dữ liệu. Google đang nỗ lực để ngăn chặn loại lỗi thu thập dữ liệu này. Lỗi này không ảnh hưởng đến việc thu thập dữ liệu hay xếp hạng trang web của bạn.

Nếu bạn không nhận ra một URL trên trang web của mình, bạn có thể bỏ qua nó. Các lỗi này xảy ra khi một người nào đó duyệt tới một URL không tồn tại trên trang web của bạn - có thể họ nhập sai URL vào trình duyệt, hoặc nhập sai URL liên kết. Tuy nhiên, bạn có thể muốn chụp một số URL bị nhập sai này như được mô tả trong danh sách nói trên.

Sau đây là những nguyên nhân có thể cho mỗi trang của bạn.

Đã gửi và chưa gửi

Cách khắc phục Báo cáo Trạng thái lập chỉ mục
Cách khắc phục Báo cáo Trạng thái lập chỉ mục

Bất cứ lúc nào bạn thấy kết quả lập chỉ mục có từ "Đã gửi" thì điều đó nghĩa là bạn đã yêu cầu Google lập chỉ mục URL đó một cách rõ ràng bằng cách gửi URL trong sơ đồ trang web.

Các trang có lỗi chưa được lập chỉ mục.

Lỗi máy chủ (5xx): Máy chủ của bạn đã trả về lỗi cấp 500 khi có yêu cầu về trang. Hãy xem phần Sửa lỗi máy chủ.

Lỗi chuyển hướng: URL có lỗi chuyển hướng. Lỗi này có thể thuộc một trong các loại sau: URL là một chuỗi chuyển hướng quá dài; URL là một vòng lặp chuyển hướng; URL chuyển hướng cuối cùng vượt quá độ dài URL tối đa; có URL không hợp lệ hoặc trống trong chuỗi chuyển hướng.

URL đã gửi bị robots.txt chặn: Bạn đã gửi trang này để lập chỉ mục nhưng trang bị robots.txt chặn. Hãy thử kiểm tra trang của bạn bằng trình kiểm tra robots.txt.

URL đã gửi được đánh dấu 'noindex' (ngăn lập chỉ mục): Bạn đã gửi trang này để lập chỉ mục nhưng trang có lệnh 'noindex' trong thẻ meta hoặc phản hồi HTML. Nếu muốn trang này được lập chỉ mục, bạn phải xóa thẻ hoặc tiêu đề HTTP.

URL đã gửi có vẻ là Soft 404: Bạn đã gửi trang này để lập chỉ mục nhưng máy chủ có vẻ đã trả về lỗi soft 404.

URL đã gửi trả về yêu cầu trái phép (401): Bạn đã gửi trang này để lập chỉ mục nhưng Google nhận được phản hồi 401 (trái phép). Hãy xóa yêu cầu ủy quyền cho trang này hoặc cho phép Googlebot truy cập vào các trang của bạn bằng cách xác minh danh tính.

URL đã gửi không tìm thấy (404): Bạn đã gửi một URL không tồn tại để lập chỉ mục. Hãy xem phần Sửa lỗi 404.

URL đã gửi có vấn đề về thu thập dữ liệu: Bạn đã gửi trang này để lập chỉ mục và Google gặp phải lỗi thu thập dữ liệu không xác định không thuộc bất kỳ lý do nào khác. Hãy thử gỡ lỗi trang của bạn bằng công cụ Kiểm tra URL.

Các trang có trạng thái cảnh báo có thể yêu cầu sự chú ý của bạn và có thể đã được hoặc chưa được lập chỉ mục, theo kết quả cụ thể.

Đã được lập chỉ mục, mặc dù bị chặn bởi robots.txt: Trang đã được lập chỉ mục mặc dù bị robots.txt chặn (Google luôn tôn trọng robots.txt, nhưng điều này không có ích gì nếu người khác có liên kết đến trang). Vấn đề này được đánh dấu là cảnh báo vì chúng tôi chắc liệu bạn có chủ đích chặn trang khỏi kết quả tìm kiếm hay không. Nếu bạn muốn chặn trang này thì robots.txt không phải là cơ chế thích hợp để ngăn lập chỉ mục . Để ngăn lập chỉ mục, bạn nên sử dụng 'noindex' hoặc chặn truy cập ẩn danh vào trang bằng cách sử dụng quy trình xác thực. Bạn có thể sử dụng trình kiểm tra robots.txt để xác định quy tắc nào đang chặn trang này. Bởi vì tệp robots.txt, bất kỳ đoạn nào được hiển thị cho trang có thể đều sẽ dưới mức tối ưu. Nếu bạn không muốn chặn trang này, hãy cập nhật tệp robots.txt để bỏ chặn trang.

Các trang có trạng thái hợp lệ đã được lập chỉ mục.

Đã gửi và lập chỉ mục: Bạn đã gửi URL để lập chỉ mục và trang đã được lập chỉ mục.

Đã lập chỉ mục, chưa được gửi trong sơ đồ trang web: URL đã được Google phát hiện và lập chỉ mục. Chúng tôi khuyên bạn nên gửi tất cả các URL quan trọng bằng cách sử dụng sơ đồ trang web.

Đã lập chỉ mục; xem xét đánh dấu là chuẩn: URL đã được lập chỉ mục. Trang này có các URL trùng lặp, nhưng chúng tôi coi URL này là phiên bản chuẩn. URL không được đánh dấu rõ ràng là trang chuẩn, và vì vậy bạn nên đánh dấu URL này là trang chuẩn một cách rõ ràng .

Các trang này thường không được lập chỉ mục, nhưng chúng tôi nghĩ đó là ý muốn của bạn.

Bị chặn bởi thẻ 'noindex' (ngăn lập chỉ mục): Khi cố gắng lập chỉ mục trang, Google đã gặp phải lệnh 'noindex' và do đó không lập chỉ mục trang. Nếu không muốn trang này được lập chỉ mục thì bạn đã đạt được mục đích của mình. Nếu muốn trang này được lập chỉ mục, bạn nên xóa lệnh 'noindex' đó.

Bị chặn bởi công cụ xóa trang: Trang hiện bị chặn bởi yêu cầu xóa URL. Nếu là chủ sở hữu trang web được xác minh, bạn có thể sử dụng công cụ xóa URL để xem ai đã gửi yêu cầu xóa URL. Yêu cầu xóa chỉ thích hợp trong một khoảng thời gian nhất định (hãy xem tài liệu được liên kết). Sau thời gian đó, Googlebot có thể quay lại và lập chỉ mục trang, ngay cả khi bạn không gửi yêu cầu lập chỉ mục khác. Nếu bạn không muốn Google lập chỉ mục trang, hãy sử dụng 'noindex', yêu cầu ủy quyền cho trang hoặc xóa trang.

Bị chặn bởi robots.txt: Trang này đã bị tệp robots.txt chặn với Googlebot. Bạn có thể xác minh điều này bằng trình kiểm tra robots.txt. Xin lưu ý rằng điều này không có nghĩa là trang sẽ không được lập chỉ mục bằng một số phương thức khác. Nếu có thể tìm thấy thông tin khác về trang này mà không cần tải trang, Google vẫn có thể lập chỉ mục trang (mặc dù điều này ít gặp hơn). Để đảm bảo rằng một trang không được lập chỉ mục bởi Google, hãy xoá quy tắc chặn trong robots.txt và sử dụng lệnh 'noindex'.

Bị chặn do yêu cầu trái phép (401): Trang đã bị chặn với Googlebot do có yêu cầu ủy quyền (phản hồi 401). Nếu bạn muốn Googlebot có thể thu thập dữ liệu trang này, hãy xoá yêu cầu ủy quyền hoặc cho phép Googlebot truy cập vào các trang của bạn.

Thu thập dữ liệu bất thường: Một điều bất thường không xác định đã xảy ra khi tìm nạp URL này. Điều này có thể là mã phản hổi cấp 4xx hoặc 5xx; hãy thử tìm nạp trang bằng cách sử dụng Tìm nạp như Google nhằm xác định xem liệu trang có gặp phải bất kỳ vấn đề tìm nạp nào không. Trang chưa được lập chỉ mục.

Đã thu thập dữ liệu - hiện chưa được lập chỉ mục: Trang đã được Google thu thập dữ liệu nhưng chưa được lập chỉ mục. Trang có thể được hoặc không được lập chỉ mục trong tương lai; bạn không cần phải gửi lại URL này để thu thập dữ liệu.

Đã thu thập dữ liệu - hiện chưa được lập chỉ mục: Trang đã được phát hiện bởi Google nhưng chưa được thu thập dữ liệu. Trường hợp thường gặp là Google đã cố thu thập dữ liệu URL này nhưng trang web đã quá tải; do đó Google phải lên lịch thu thập lại dữ liệu. Đây là lý do tại sao ngày thu thập dữ liệu cuối cùng để trống trên báo cáo.

Trang thay thế có thẻ chuẩn thích hợp: Trang này trùng lặp với một trang mà Google công nhận là trang chuẩn. Trang này trỏ đến trang chuẩn thích hợp, do vậy bạn không cần phải làm gì.

Trang trùng lặp không có thẻ chuẩn: Trang này có các trang trùng lặp nhưng không trang nào trong số đó được đánh dấu là chuẩn. Chúng tôi nghĩ rằng trang này không phải là trang chuẩn. Bạn nên đánh dấu trang chuẩn cho trang này một cách rõ ràng. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

Trang trùng lặp không phải HTML: Một trang không phải HTML (ví dụ: tệp PDF) là bản sao của một trang khác mà Google đã đánh dấu là trang chuẩn. Thường chỉ có URL chuẩn sẽ được hiển thị trong Google Tìm kiếm. Nếu muốn, bạn có thể chỉ định trang chuẩn bằng cách sử dụng tiêu đề HTTP liên kết trong phản hồi.

Google chọn trang chuẩn khác với người dùng: URL này được đánh dấu là trang chuẩn cho một tập hợp trang, nhưng Google nghĩ rằng một URL khác là phiên bản chuẩn thích hợp hơn. Google đã lập chỉ mục trang mà chúng tôi xem là trang chuẩn chứ không phải trang này. Bạn nên đánh dấu trang này là trang trùng lặp của URL chuẩn một cách rõ ràng. Google đã phát hiện thấy trang này mặc dù không có yêu cầu thu thập dữ liệu rõ ràng. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

Không tìm thấy (404): Trang này đã trả về lỗi 404 khi được yêu cầu. Google đã phát hiện thấy URL này mặc dù không có yêu cầu rõ ràng hay sơ đồ trang web nào. Google có thể đã phát hiện thấy URL dưới dạng liên kết từ một trang web khác hoặc có thể trang đã tồn tại trước đó và đã bị xóa. Googlebot có thể sẽ tiếp tục thử thu thập dữ liệu URL này trong một khoảng thời gian. Không có cách nào để yêu cầu Googlebot quên một URL vĩnh viễn, mặc dù Googlebot sẽ thu thập dữ liệu URL đó ít thường xuyên hơn. Các phản hồi 404 không phải là vấn đề nếu do chủ đích. Nếu trang của bạn đã di chuyển, hãy sử dụng chuyển hướng 301 tới vị trí mới. Hãy đọc phần Sửa lỗi 404

Trang bị xóa bởi có khiếu nại pháp lý: Trang đã bị xoá khỏi chỉ mục do khiếu nại pháp lý.

Trang có chuyển hướng: URL là một chuyển hướng và do đó không được thêm vào chỉ mục.

Đã đưa vào hàng đợi thu thập dữ liệu: Trang đang ở trong hàng đợi thu thập dữ liệu; hãy kiểm tra lại sau vài ngày để xem Google đã thu thập dữ liệu trang chưa.

Soft 404: Yêu cầu trang trả về lỗi mà chúng tôi nghĩ là phản hồi soft 404. Điều này có nghĩa là trang trả về thông báo "not found" (không tìm thấy) thân thiện với người dùng mà không kèm theo mã phản hồi 404 tương ứng. Bạn nên trả về mã phản hồi 404 cho các trang "not found" (không tìm thấy) thực sự hoặc thêm thông tin khác vào trang để cho chúng tôi biết rằng đó không phải là mã soft 404. Tìm hiểu thêm

URL đã gửi bị loại bỏ: Bạn đã gửi trang này để lập chỉ mục nhưng trang đã bị loại khỏi chỉ mục vì một lý do không xác định.

URL đã gửi không được chọn là trang chuẩn: URL thuộc một tập hợp các URL trùng lặp mà trong đó không có trang chuẩn được đánh dấu rõ ràng. Bạn đã yêu cầu URL này được lập chỉ mục một cách rõ ràng, nhưng vì URL là trang trùng lặp và Google nghĩ rằng một URL khác là trang chuẩn thích hợp hơn, Google đã không lập chỉ mục URL này. Thay vào đó, chúng tôi đã lập chỉ mục trang chuẩn mà chúng tôi chọn. (Google chỉ lập chỉ mục trang chuẩn trong một nhóm các trang trùng lặp.) Sự khác nhau giữa trạng thái này và "Google chọn trang chuẩn khác với người dùng" là bạn đã yêu cầu lập chỉ mục một cách rõ ràng trong trường hợp này. Bạn sẽ thấy URL chuẩn do Google chọn khi kiểm tra URL này.

 

Sau khi khắc phục tất cả các trường hợp của một vấn đề cụ thể trên trang web của mình, bạn có thể yêu cầu Google xác thực các thay đổi. Nếu tất cả các trường hợp đã biết biến mất thì vấn đề sẽ được đánh dấu là đã khắc phục trong bảng trạng thái và đưa xuống cuối bảng. Search Console theo dõi trạng thái xác thực của vấn đề nói chung, cũng như trạng thái của từng trường hợp trong vấn đề đó. Khi tất cả các trường hợp của vấn đề biến mất, vấn đề sẽ được coi là đã khắc phục. (Để biết các trạng thái thực tế được ghi lại, hãy xem Trạng thái xác thực vấn đề và Trạng thái xác thực trường hợp.)

Thời gian tồn tại của một vấn đề kéo dài từ lần đầu tiên phát hiện thấy bất kỳ trường hợp nào của vấn đề trên trang web của bạn cho đến 90 ngày sau khi trường hợp cuối cùng được đánh dấu là đã biến mất khỏi trang web. Nếu 90 ngày trôi qua mà không có trường hợp lặp lại nào, vấn đề sẽ bị xóa khỏi lịch sử báo cáo.

Ngày phát hiện đầu tiên của vấn đề là ngày đầu tiên phát hiện thấy vấn đề trong suốt thời gian tồn tại này và sẽ không thay đổi. Vì thế:

Dưới đây là tổng quan về quy trình xác thực sau khi bạn nhấp vào Xác thực khắc phục cho một vấn đề. Quy trình này có thể mất vài ngày và bạn sẽ nhận được thông báo tiến độ qua email.

Ngay cả khi bạn không bao giờ nhấp vào "bắt đầu xác thực" Google vẫn có thể phát hiện thấy các trường hợp đã khắc phục của một vấn đề. Nếu phát hiện thấy tất cả các trường hợp của một vấn đã được khắc phục trong quá trình thu thập dữ liệu thông thường, Google sẽ thay đổi trạng thái vấn đề thành "N/A" (Không áp dụng) trên báo cáo.

Khi nào vấn đề được xem là "đã khắc phục" cho một URL hay một mục?

Vấn đề được đánh dấu là đã khắc phục cho một URL hoặc một mục khi đáp ứng một trong các điều kiện sau:

Khi bạn nhấp vào Xác thực lại cho một quy trình xác thực không thành công, quy trình sẽ bắt đầu lại với tất cả các trường hợp không thành công, cộng thêm bất kỳ trường hợp mới nào của vấn đề mà Google phát hiện thấy trong quá trình thu thập dữ liệu thông thường.

Bạn nên đợi chu kỳ xác thực hoàn tất trước khi yêu cầu một chu kỳ khác, ngay cả khi bạn đã khắc phục một số vấn đề trong chu kỳ hiện tại.

Các trường hợp đã vượt qua xác thực (được đánh dấu là Đã vượt qua) hoặc không thể truy cập được nữa (được đánh dấu là Khác) sẽ không được kiểm tra lại và bị xóa khỏi lịch sử khi bạn nhấp vào Xác thực lại.

Bạn có thể xem tiến trình của yêu cầu xác thực bằng cách nhấp vào liên kết chi tiết xác thực trong trang chi tiết vấn đề.

Các mục trong lịch sử xác thực được nhóm theo URL cho báo cáo AMP và báo cáo Trạng thái lập chỉ mục. Trong báo cáo Khả năng sử dụng trên thiết bị di động và Kết quả nhiều định dạng, các mục được nhóm theo kết hợp URL + mục dữ liệu có cấu trúc (như được xác định bởi giá trị Tên của mục). Trạng thái xác thực sẽ áp dụng cho vấn đề cụ thể mà bạn đang kiểm tra. Bạn có thể thấy một vấn đề gắn nhãn "Đã vượt qua" trên một trang, nhưng các vấn đề khác lại bị gắn nhãn "Không đạt", "Đang chờ xử lý" hoặc "Khác".

Các trạng thái xác thực sau đây áp dụng cho một vấn đề nhất định:

Sau khi có yêu cầu xác thực, mọi trường hợp đã biết đều được chỉ định một trong các trạng thái xác thực sau đây cho một vấn đề cụ thể (trạng thái Đã vượt qua và Khác không được sử dụng trong báo cáo Trạng thái lập chỉ mục):

Xin lưu ý rằng cùng một URL có thể có trạng thái khác nhau cho các vấn đề khác nhau. Ví dụ: n


Tuấn Nguyễn

342Blog posts

Related post