Ở phần trước, Haravan đã chia sẻ với bạn những khái niệm và cách sử dụng Google Search Console hiệu quả. Tiếp tục phần này Haravan sẽ giúp bạn tổng hợp các lỗi Google Search Console thường gặp và những cách khắc phục giúp bạn sử dụng công cụ này hiệu quả hơn. Cùng xem nhé!
Xem lại Phần 1: Google Search Console là gì? Hướng dẫn cách sử dụng GSC hiệu quả
1. Bố cục Lỗi thu thập thông tin
Bố cục lỗi thu thập thông tin Một thay đổi đã phát triển trong vài năm qua là bố cục của chế độ xem Lỗi thu thập thông tin trong Search Console. Search Console được chia thành hai phần chính: Lỗi trang web và Lỗi URL.
Việc phân loại lỗi theo cách này khá hữu ích vì có sự khác biệt rõ rệt giữa lỗi ở cấp trang và lỗi ở cấp trang. Các vấn đề ở cấp độ trang web có thể nghiêm trọng hơn, với khả năng làm hỏng khả năng sử dụng tổng thể của trang web của bạn. Mặt khác, lỗi URL dành riêng cho các trang riêng lẻ và do đó ít khẩn cấp hơn.
Cách nhanh nhất để truy cập Lỗi thu thập thông tin là từ trang tổng quan. Trang tổng quan chính cung cấp cho bạn bản xem trước nhanh chóng về trang web của mình, hiển thị cho bạn ba công cụ quản lý quan trọng nhất: Lỗi thu thập thông tin, Phân tích tìm kiếm và Sơ đồ trang web.
Bạn có thể xem nhanh các lỗi thu thập thông tin của mình từ đây. Ngay cả khi bạn chỉ nhìn lướt qua nó hàng ngày, bạn sẽ tiến xa hơn nhiều so với hầu hết các nhà quản lý trang web.
2. Lỗi trang web
Phần Lỗi trang web hiển thị cho bạn các lỗi nói chung từ trang web của bạn. Đây là những lỗi cấp cao ảnh hưởng đến toàn bộ trang web của bạn, vì vậy đừng bỏ qua những lỗi này.
Trong trang tổng quan Lỗi thu thập thông tin, Google sẽ hiển thị cho bạn những lỗi này trong 90 ngày qua.
Nếu bạn có một số loại hoạt động trong 90 ngày qua, đoạn mã của bạn sẽ trông giống như sau:
Đoạn mã khi bạn có một số lỗi trong 90 ngày qua
Nếu bạn không có lỗi 100% trong 90 ngày qua mà không có gì để hiển thị, nó sẽ trông như thế này:
Đoạn mã nếu bạn không có lỗi 100% trong 90 ngày qua
Đó là mục tiêu – để có được một “Đẹp!” từ Google. Là những người làm SEO, chúng tôi thường không nhận được bất kỳ xác nhận nào từ Google, vì vậy hãy tận hưởng khoảnh khắc yêu thương hiếm có này.
3. Tìm và fix lỗi phạm vi Index trong Google Search Console
Khi Google thu thập dữ liệu và Index trang web của bạn, Google sẽ theo dõi kết quả và báo cáo chúng trong báo cáo Phạm vi Index của Google Search Console (mở trong một tab mới).
Về cơ bản, đó là phản hồi về các chi tiết kỹ thuật khác của quy trình Index và thu thập dữ liệu trang web của bạn. Trong trường hợp họ phát hiện ra vấn đề cấp bách, họ sẽ gửi thông báo.
Các vấn đề được báo cáo chia thành bốn trạng thái:
- Có hiệu lực
- Hợp lệ với cảnh báo
- Lỗi
- Bị loại trừ
Tìm và fix lỗi phạm vi Index trong Google Search Console
3.1 Khi nào bạn nên sử dụng báo cáo Phạm vi Index?
Đối với các trang web như thế này, họ khuyên bạn nên sử dụng toán tử site: của họ.
Nếu lưu lượng truy cập không phải trả tiền từ Google là cần thiết cho doanh nghiệp của bạn, bạn cần sử dụng báo cáo Phạm vi Index của họ, vì báo cáo này cung cấp thông tin chi tiết và đáng tin cậy hơn nhiều so với việc sử dụng toán tử site: của họ để gỡ lỗi các vấn đề Index.
3.2 Báo cáo Phạm vi Chỉ mục đã giải thích
Báo cáo Phạm vi Chỉ mục đã giải thích
Tìm báo cáo Phạm vi Index của riêng bạn bằng cách làm theo các bước sau:
- Đăng nhập vào Google Search Console.
- Chọn một tài sản.
- Nhấp vào Mức độ phù hợp trong Chỉ mục trong điều hướng bên trái.
4. URL hợp lệ
Các lỗi URL hợp lệ và cách giải quyết
Như đã đề cập ở trên, “URL hợp lệ” là các trang đã được Index. Hai loại sau nằm trong trạng thái “Hợp lệ”:
- Đã gửi và Index
- Đã Index, chưa được gửi trong sơ đồ trang web
4.1 Đã Index, chưa được gửi trong sơ đồ trang web
Các URL này không được gửi qua sơ đồ trang XML, nhưng Google vẫn tìm thấy và Index chúng.
Hành động bắt buộc: xác minh xem các URL này có cần được Index hay không và nếu có, hãy thêm chúng vào sơ đồ trang XML của bạn. Nếu không, hãy đảm bảo bạn triển khai lệnh ngăn Index của rô bốt và tùy chọn loại trừ chúng trong tệp robots.txt của bạn nếu chúng có thể gây ra các vấn đề về ngân sách thu thập thông tin.
Mẹo chuyên nghiệp: Nếu bạn có sơ đồ trang XML, nhưng bạn chỉ đơn giản là chưa gửi nó đến Google Search Console, tất cả các URL sẽ được báo cáo với kiểu: “Đã Index, chưa được gửi trong sơ đồ trang web” – điều này hơi khó hiểu.
Việc chia sơ đồ trang web XML thành các sơ đồ trang web nhỏ hơn cho các trang web lớn (ví dụ hơn 10.000 trang) là rất hợp lý, vì điều này giúp bạn nhanh chóng có được cái nhìn sâu sắc về bất kỳ vấn đề nào về khả năng Index cho mỗi phần hoặc loại nội dung.
4.2 Đã Index, mặc dù Blocked bởi robots.txt
Google đã Index các URL này, nhưng chúng đã bị tệp robots.txt của bạn chặn. Thông thường, Google sẽ không Index các URL này, nhưng rõ ràng là họ đã tìm thấy các liên kết đến các URL này và do đó, vẫn tiếp tục và Index chúng. Có vẻ như các đoạn mã được hiển thị là không tối ưu.
Hành động bắt buộc: xem xét các URL này, cập nhật tệp robots.txt của bạn và có thể áp dụng lệnh ngăn Index của rô bốt.
4.3 Được Index mà không có nội dung
Google đã Index các URL này, nhưng Google không thể tìm thấy bất kỳ nội dung nào trên chúng. Lý do có thể cho điều này có thể là:
- Kỹ thuật che giấu (mở trong một tab mới)
- Google không thể hiển thị trang vì chúng đã Blocked và chẳng hạn như nhận được mã trạng thái HTTP 403.
- Nội dung ở định dạng mà Google không Index
- Một trang trống đã được xuất bản.
Hành động bắt buộc: xem xét các URL này để kiểm tra kỹ xem chúng có thực sự không chứa nội dung hay không. Sử dụng cả trình duyệt của bạn và Công cụ kiểm tra URL của Google Search Console để xác định những gì Google nhìn thấy khi yêu cầu các URL này. Nếu mọi thứ đều ổn, chỉ cần yêu cầu Index lại.
4.4 Trang thay thế có thẻ chuẩn phù hợp
Các URL này là bản sao của các URL khác và được chuẩn hóa phù hợp với phiên bản ưa thích của URL.
Hành động bắt buộc: nếu các trang này không nên được chuẩn hóa, hãy thay đổi trang chuẩn để làm cho nó tự tham chiếu. Ngoài ra, hãy theo dõi số lượng trang được liệt kê ở đây. Nếu bạn đang thấy sự gia tăng lớn trong khi trang web của bạn không tăng nhiều trong các trang có thể Index, thì bạn có thể đang gặp vấn đề về cấu trúc liên kết nội bộ kém và / hoặc vấn đề ngân sách thu thập dữ liệu.
4.5 Blocked bởi công cụ xóa trang
Các URL này hiện không được hiển thị trong kết quả tìm kiếm của Google do yêu cầu xóa URL. Khi các URL bị ẩn theo cách này, chúng sẽ bị ẩn khỏi kết quả tìm kiếm của Google trong 90 ngày. Sau khoảng thời gian đó, Google có thể đưa các URL này trở lại bề mặt.
Tính năng yêu cầu xóa URL (mở trong tab mới) chỉ nên được sử dụng như một biện pháp nhanh chóng, tạm thời để ẩn URL. Chúng tôi luôn khuyên bạn nên thực hiện các biện pháp bổ sung để thực sự ngăn chặn các URL này xuất hiện trở lại.
Hành động bắt buộc: gửi cho Google một tín hiệu rõ ràng rằng họ không nên Index các URL này thông qua lệnh ngăn Index của rô bốt và đảm bảo rằng các URL này được thu thập lại thông tin trước khi hết hạn 90 ngày
4.6 Blocked bởi robots.txt
Các URL này Blocked do tệp robots.txt của trang web và không được Google Index. Điều này có nghĩa là Google không tìm thấy tín hiệu đủ mạnh để đảm bảo Index các URL này. Nếu có, các URL sẽ được liệt kê trong “Đã Index, mặc dù Blocked bởi robots.txt”.
Hành động bắt buộc: đảm bảo không có bất kỳ URL quan trọng nào trong số những URL được liệt kê trong phần tổng quan này.
4.7 Blocked do truy cập bị cấm (403)
Google không được phép truy cập các URL này và đã nhận được mã phản hồi HTTP 403.
Hành động bắt buộc: đảm bảo rằng Google (và các công cụ tìm kiếm khác) có quyền truy cập không hạn chế vào các URL bạn muốn xếp hạng. Nếu các URL mà bạn không muốn xếp hạng được liệt kê trong loại vấn đề này, thì tốt nhất bạn chỉ nên áp dụng lệnh noindex (trong nguồn HTML hoặc tiêu đề HTTP).
4.8 Blocked do sự cố 4xx khác
Google không thể truy cập các URL này vì họ đã nhận được mã phản hồi 4xx không phải là 401, 403 và 404. Ví dụ: điều này có thể xảy ra với các URL không đúng định dạng, những URL này đôi khi trả về mã phản hồi 400.
Hành động bắt buộc: hãy thử tìm nạp các URL này bằng công cụ kiểm tra URL để xem liệu bạn có thể tái tạo hành vi này hay không. Nếu những URL này quan trọng đối với bạn, hãy điều tra xem điều gì đang xảy ra, khắc phục sự cố và thêm URL vào sơ đồ trang XML của bạn. Nếu bạn không muốn xếp hạng với các URL này, thì chỉ cần đảm bảo bạn xóa mọi tham chiếu đến chúng.
4.9 Blocked do yêu cầu trái phép (401)
Google không thể truy cập được các URL này vì khi yêu cầu chúng, Google đã nhận được phản hồi HTTP 401, có nghĩa là họ không được phép truy cập vào các URL. Thông thường, bạn sẽ thấy điều này đối với môi trường dàn dựng, những môi trường này không thể truy cập được đối với thế giới bằng Xác thực HTTP.
Hành động bắt buộc: đảm bảo không có bất kỳ URL quan trọng nào trong số những URL được liệt kê trong phần tổng quan này. Nếu có, bạn cần phải điều tra lý do tại sao, bởi vì đó sẽ là một vấn đề SEO nghiêm trọng. Nếu môi trường dàn dựng của bạn được liệt kê, hãy điều tra cách Google tìm thấy nó và xóa mọi tham chiếu đến nó. Hãy nhớ rằng, cả liên kết nội bộ và liên kết bên ngoài đều có thể là nguyên nhân của điều này. Nếu các công cụ tìm kiếm có thể tìm thấy những thứ đó, thì rất có thể khách truy cập cũng có thể.
5. Thu thập thông tin bất thường
Các lỗi thu thập thông tin bất thường và cách giải quyết
Các URL này không được Index vì Google đã gặp phải “sự cố bất thường khi thu thập thông tin” khi yêu cầu chúng. Thu thập thông tin bất thường có thể có nghĩa là họ đã nhận được mã phản hồi trong phạm vi 4xx và 5xx không được liệt kê với các loại riêng của họ trong báo cáo Trạng thái Index.
Hành động bắt buộc: hãy thử tìm nạp một số URL bằng công cụ kiểm tra URL để xem liệu bạn có thể tái tạo sự cố hay không. Nếu bạn có thể, hãy điều tra xem chuyện gì đang xảy ra. Nếu bạn không thể tìm thấy bất kỳ vấn đề nào và mọi thứ đều hoạt động tốt, hãy theo dõi vì nó có thể chỉ là vấn đề tạm thời.
5.1 Đã thu thập thông tin – hiện chưa được Index
Các URL này đã được Google thu thập thông tin, nhưng chưa được Index (chưa). Các lý do có thể xảy ra tại sao một URL có thể có loại này:
URL gần đây đã được thu thập thông tin và vẫn đang được Index.
Google biết về URL, nhưng không thấy nó đủ quan trọng để Index nó. Ví dụ: vì nó có ít hoặc không có liên kết nội bộ, nội dung trùng lặp hoặc nội dung mỏng.
Đã thu thập thông tin - hiện chưa được index
Hành động bắt buộc: đảm bảo không có URL quan trọng trong số những URL trong tổng quan này. Nếu bạn tìm thấy các URL quan trọng, hãy kiểm tra thời điểm chúng được thu thập thông tin. Nếu nó mới xuất hiện và bạn biết rằng URL này có đủ liên kết nội bộ để được Index, thì điều đó có thể sẽ sớm xảy ra.
5.2 Đã khám phá – hiện chưa được Index
Những URL này đã được Google tìm thấy nhưng chưa được thu thập thông tin — và do đó được Index — chưa được Index. Google biết về chúng và chúng được xếp hàng để thu thập thông tin. Điều này có thể là do Google đã yêu cầu các URL này và không thành công vì trang web đã quá tải hoặc đơn giản là họ chưa thu thập được thông tin.
Đã khám phá - hiện chưa được Index
Hành động bắt buộc: hãy để ý đến điều này. Nếu số lượng URL tăng lên, bạn có thể đang gặp vấn đề về ngân sách thu thập dữ liệu: trang web của bạn đang đòi hỏi nhiều sự chú ý hơn Google muốn chi cho nó. Điều này có thể là do trang web của bạn không có đủ quyền hạn hoặc quá chậm hoặc thường xuyên không khả dụng.
5.3 Sao y không có trang chuẩn do người dùng chọn
Theo Google, những URL này là trùng lặp. Chúng không được chuẩn hóa cho phiên bản ưa thích của URL và Google cho rằng những URL này không phải là phiên bản ưa thích. Do đó, họ đã quyết định loại trừ các URL này khỏi chỉ mục của mình.
Thông thường, bạn sẽ tìm thấy các tệp PDF trùng lặp 100% với các tệp PDF khác trong số các URL này.
Hành động bắt buộc: thêm URL chuẩn vào các phiên bản URL ưa thích, chẳng hạn như trang chi tiết sản phẩm. Nếu các URL này hoàn toàn không được Index, hãy đảm bảo áp dụng lệnh ngăn Index thông qua thẻ meta rô bốt hoặc Tiêu đề HTTP X-Robots-Tag. Khi bạn đang sử dụng công cụ Kiểm tra URL, Google thậm chí có thể hiển thị cho bạn phiên bản chuẩn của URL.
5.4 Trùng lặp, Google đã chọn trang chuẩn khác với người dùng
Google đã tự tìm thấy các URL này và coi chúng là bản sao. Mặc dù bạn đã chuẩn hóa chúng cho URL ưa thích của mình, Google vẫn chọn bỏ qua điều đó và áp dụng một chuẩn khác.
Bạn sẽ thường thấy rằng Google chọn các trang chuẩn khác nhau trên các trang web đa ngôn ngữ có các trang rất giống nhau và nội dung mỏng.
Hành động bắt buộc: Sử dụng công cụ kiểm tra URL để tìm hiểu xem Google đã chọn URL nào làm URL ưa thích và xem điều đó có hợp lý hơn không. Ví dụ: có thể Google đã chọn một trang chuẩn khác vì nó có nhiều liên kết và / hoặc nhiều nội dung hơn.
URL trùng lặp, đã gửi không được chọn làm chuẩn
Bạn đã gửi các URL này thông qua sơ đồ trang XML, nhưng chúng không có bộ URL chuẩn. Google coi các URL này là bản sao của các URL khác và do đó đã chọn chuẩn hóa các URL này bằng các URL chuẩn do Google chọn.
Xin lưu ý rằng kiểu này rất giống với kiểu Sao chép, Google đã chọn trang chuẩn khác với người dùng, nhưng khác nhau theo hai cách:
- Bạn đã yêu cầu Google Index các trang này một cách rõ ràng.
- Bạn chưa xác định các URL chuẩn.
Hành động bắt buộc: thêm các URL chuẩn phù hợp trỏ đến phiên bản ưa thích của URL.
5.5 Bị loại trừ bởi thẻ ‘noindex’
Các URL này chưa được Google Index vì lệnh ngăn Index (trong nguồn HTML hoặc tiêu đề HTTP).
Hành động bắt buộc: đảm bảo không có URL quan trọng trong số những URL được liệt kê trong tổng quan này. Nếu bạn tìm thấy các URL quan trọng, hãy xóa lệnh ngăn Index và sử dụng công cụ Kiểm tra URL để yêu cầu Index. Kiểm tra kỹ xem có bất kỳ liên kết nội bộ nào trỏ đến các trang này không, vì bạn không muốn các trang không Index này hiển thị công khai.
Xin lưu ý rằng, nếu bạn muốn làm cho các trang không thể truy cập được, cách tốt nhất để thực hiện điều đó là triển khai xác thực HTTP.
5.6 Không tìm thấy (404)
Các URL này không được đưa vào sơ đồ trang XML, nhưng bằng cách nào đó Google đã tìm thấy chúng và không thể Index chúng vì chúng trả về mã trạng thái HTTP 404. Có thể Google đã tìm thấy các URL này thông qua các trang web khác hoặc những URL này đã tồn tại trong quá khứ.
Hành động bắt buộc: đảm bảo không có URL quan trọng trong số những URL được liệt kê trong tổng quan này. Nếu bạn tìm thấy các URL quan trọng, hãy khôi phục nội dung trên các URL này hoặc chuyển hướng 301 URL đến thay thế phù hợp nhất. Nếu bạn không chuyển hướng đến một giải pháp thay thế có liên quan cao, URL này có thể được xem là một mã 404 mềm.
5.7 Trang bị xóa vì khiếu nại pháp lý
Các URL này đã bị xóa khỏi chỉ mục của Google do có khiếu nại pháp lý.
Hành động bắt buộc: đảm bảo rằng bạn biết mọi URL được liệt kê trong phần tổng quan này, vì ai đó có ác ý có thể đã yêu cầu xóa URL của bạn khỏi chỉ mục của Google.
5.8 Soft 404
Các URL này được coi là phản hồi mềm 404, có nghĩa là các URL không trả lại mã trạng thái HTTP 404 nhưng nội dung tạo ấn tượng rằng thực tế là trang 404, chẳng hạn bằng cách hiển thị thông báo “Không thể tìm thấy trang”. Ngoài ra, những lỗi này có thể là kết quả của các chuyển hướng trỏ đến các trang được Google coi là không đủ liên quan. Lấy ví dụ một trang chi tiết sản phẩm được chuyển hướng đến các trang danh mục của nó hoặc thậm chí đến trang chủ.
Hành động bắt buộc: nếu các URL này là 404 thực, hãy đảm bảo rằng chúng trả về mã trạng thái HTTP 404 thích hợp. Nếu chúng hoàn toàn không phải là 404, thì hãy đảm bảo rằng nội dung phản ánh điều đó.
6. URL lỗi
Các trạng thái URL lỗi và cách khắc phục
Trạng thái “Lỗi” bao gồm các loại sau:
6.1 Lỗi chuyển hướng
Không thể thu thập thông tin các URL được chuyển hướng này vì Google đã gặp lỗi chuyển hướng. Dưới đây là một số ví dụ về các vấn đề tiềm ẩn mà Google có thể gặp phải:
- Các vòng lặp chuyển hướng
- Chuỗi chuyển hướng quá dài (Google tuân theo năm chuyển hướng cho mỗi lần thử thu thập thông tin)
- Chuyển hướng đến một URL quá dài
Lỗi chuyển hướng URL
Hành động bắt buộc: điều tra xem điều gì đang xảy ra với những chuyển hướng này và khắc phục chúng. Dưới đây là cách dễ dàng kiểm tra mã trạng thái HTTP của bạn để bạn có thể bắt đầu gỡ lỗi chúng.
6.2 Lỗi máy chủ (5xx)
Các URL này trả về lỗi 5xx cho Google, ngăn Google thu thập dữ liệu trang này.
Hành động bắt buộc: điều tra lý do tại sao URL trả về lỗi 5xx và sửa lỗi đó. Thông thường, bạn thấy rằng những lỗi 5xx này chỉ là tạm thời do máy chủ quá bận. Hãy nhớ rằng tác nhân người dùng thực hiện yêu cầu có thể ảnh hưởng đến mã trạng thái HTTP nào được trả về, vì vậy hãy đảm bảo sử dụng tác nhân người dùng của Googlebot.
6.3 URL đã gửi bị chặn bởi robots.txt
Bạn đã gửi các URL này qua một sơ đồ trang XML, nhưng chúng không được Index vì bị Google chặn thông qua tệp robots.txt. Loại này rất giống với hai loại khác mà chúng tôi đã đề cập ở trên.
Đây là cách cái này khác biệt:
- Nếu các URL đã được Index, chúng sẽ được liệt kê trong “Đã được Index, mặc dù bị chặn bởi robots.txt”.
- Nếu các URL được Index và không được gửi qua sơ đồ trang XML, chúng sẽ được liệt kê trong loại “Bị chặn bởi robots.txt”.
Đây là những khác biệt nhỏ, nhưng sẽ giúp ích rất nhiều khi nói đến các vấn đề gỡ lỗi như thế này.
Cần hành động:
- Đảm bảo URL trong website không bị chặn bởi tệp robots.txt
- Kiểm tra URL đảm bảo tính truy cập
6.4 URL đã gửi bị chặn do sự cố 4xx khác
Bạn đã URL đến google, nhưng google chỉ nhận được response 401, 403 và 404.
Hành động bắt buộc: hãy thử tìm nạp các URL này bằng công cụ kiểm tra URL để xem liệu bạn có thể tái tạo sự cố hay không. Nếu bạn có thể, hãy điều tra những gì đang xảy ra và khắc phục nó.
6.5 URL đã gửi có vấn đề về thu thập thông tin
Loại “URL đã gửi có vấn đề thu thập thông tin” này là “giải quyết tất cả” cho các vấn đề thu thập thông tin không phù hợp với bất kỳ loại nào khác.
Thông thường, các vấn đề thu thập thông tin này chỉ mang tính chất tạm thời và sẽ nhận được phân loại “thông thường” (chẳng hạn như “Không tìm thấy (404)”) khi kiểm tra lại chúng.
Hành động bắt buộc: hãy thử tìm nạp một số URL bằng công cụ kiểm tra URL để xem liệu bạn có thể tái tạo sự cố hay không. Nếu bạn có thể, hãy điều tra xem chuyện gì đang xảy ra. Nếu bạn không thể tìm thấy bất kỳ vấn đề nào và mọi thứ đều hoạt động tốt, hãy theo dõi vì nó có thể chỉ là vấn đề tạm thời.
6.6 URL đã gửi được đánh dấu là ‘noindex’
Kiểm tra thẻ noindex trong các trang được google index
Cần hành động:
- Đảm bảo noindex đúng trang.
- Các trang không quan trọng không nên được liệt kê trong XML.
6.7 Không tìm thấy URL đã gửi (404)
Bạn gửi URL và các URL này không tồn tại.
Loại này rất giống với loại “Không tìm thấy (404)” mà chúng tôi đã đề cập trước đó, điểm khác biệt duy nhất là trong trường hợp này, bạn đã gửi URL thông qua sơ đồ trang web XML.
Cần hành động:
- Khôi phục nội dung hoặc sử dụng 301 chuyển hướng URL.
- Nếu không, hãy xóa các URL này khỏi sơ đồ trang XML.
6.8 URL trả về Soft 404
Bạn đã gửi các URL này thông qua một sơ đồ trang XML, nhưng Google coi chúng là “soft 404”. Các URL này có thể trả về mã trạng thái HTTP 200, trong khi trên thực tế hiển thị trang 404 hoặc nội dung trên trang tạo ấn tượng rằng đó là trang 404.
Loại này rất giống với loại Soft 404 mà chúng tôi đã đề cập trước đó, điểm khác biệt duy nhất là trong trường hợp này, bạn đã gửi các URL này thông qua sơ đồ trang web XML.
Cần hành động:
- Nếu các URL này là 404 thực, hãy đảm bảo rằng chúng trả về mã trạng thái HTTP 404 thích hợp và được xóa khỏi sơ đồ trang XML.
- Nếu chúng hoàn toàn không phải là 404, thì hãy đảm bảo rằng nội dung phản ánh điều đó.
6.9 URL đã gửi trả về 403
Các URL đã được đưa lên Google nhưng khi Googlebot truy cập nhận được response 403 trong http
Hành động: nếu các URL được công khai và publish hãy đảm bảo cho phép truy cập. Nếu không hãy xóa nó đi.
6.10 URL đã gửi trả về yêu cầu trái phép (401)
Bạn gửi URL này sử dụng XML, nhưng Google khi index chỉ nhận được HTTP 401.
Điều này thường thấy đối với các môi trường dàn dựng mà thế giới không thể truy cập được bằng cách sử dụng Xác thực HTTP.
Loại này rất giống với loại “Bị chặn do yêu cầu trái phép (401)” mà chúng tôi đã đề cập trước đó, điểm khác biệt duy nhất là trong trường hợp này, bạn đã gửi các URL này qua sơ đồ trang web XML.
Hành động bắt buộc: điều tra xem mã trạng thái HTTP 401 có được trả lại chính xác hay không. Nếu đúng như vậy, hãy xóa các URL này khỏi sơ đồ trang web XML. Nếu không, hãy cho phép Google truy cập vào các URL này.
7. Kết luận
Trên đây là tổng hợp những lỗi Google Search Console thường gặp và những cách giải quyết tương ứng. Trong thời đại 4.0 như hiện nay, khi mà website đóng vai trò rất quan trọng giúp doanh nghiệp phát triển thì công cụ này sẽ giúp bạn dễ dàng theo dõi và tối ưu website của mình. Chúc các bạn thành công!
Nguồn: https://kythuatseo.net/
Haraweb - Tất cả những gì bạn cần để thiết kế website kinh doanh vượt trội. Dù bạn đang kinh doanh bất cứ ngành hàng nào, Haravan đều hỗ trợ bạn xây dựng website kinh doanh, quản lý tập trung và marketing online một cách hiệu quả nhất.
- Thiết kế giao diện website dễ dàng với hơn 400 giao diện có sẵn.
- Website chuẩn SEO, tối ưu hóa tìm kiếm theo chuẩn Google giúp tăng tỷ lệ chuyển đổi đơn hàng.
- Tính năng responsive cho nhiều thiết bị, hỗ trợ trải nghiệm trên di động mượt mà.
- Website tốc độ cao, băng thông không giới hạn, miễn phí hosting.