Cách khắc phục lỗi thu thập dữ liệu google webmaster

Bạn đang gặp lỗi thu thập dữ liệu Google Webmaster (trước đây gọi là Webmaster Tool) và bạn thấy rất nhiều lỗi thu thập thông tin mà bạn không biết bắt đầu từ đâu. Lỗi 404, 500, 400 ..

Lỗi thu thập thông tin là điều bạn thường có thể tránh được và chúng không nhất thiết có tác động tiêu cực ngay lập tức đến hiệu suất SEO của bạn. Tuy nhiên, lỗi này cần được giải quyết. Số lượng lỗi thu thập dữ liệu thấp trong Google Webmaster là một dấu hiệu tích cực đối với Google, vì nó phản ánh tình trạng của một trang web. Ngoài ra, nếu bot của Google gặp ít lỗi thu thập dữ liệu hơn trên trang của bạn, người dùng sẽ ít thấy lỗi trang web và máy chủ của bạn hơn.

Hướng dẫn khắc phục lỗi thu thập dữ liệu Google Webmaster

Đánh dấu tất cả các lỗi thu thập thông tin là đã sửa

Đây có vẻ là một lời khuyên ngớ ngẩn, nhưng nó thực sự sẽ giúp bạn giải quyết các lỗi thu thập thông tin của mình theo cách có cấu trúc hơn. Khi bạn lần đầu tiên xem báo cáo lỗi thu thập thông tin, bạn có thể thấy hàng trăm và hàng nghìn lỗi thu thập thông tin. Có thể khó tìm ra cách vượt qua danh sách dài các lỗi này.

Đầu tiên, đánh dấu tất cả các lỗi thu thập dữ liệu là đã sửa
Đầu tiên, đánh dấu tất cả các lỗi thu thập dữ liệu là đã sửa

Các lỗi thu thập dữ liệu google webmaster không liên quan sẽ không hiển thị lại và các lỗi thực tế cần sửa sẽ sớm xuất hiện trong báo cáo của bạn. bạn bè.

Kiểm tra báo cáo lỗi thu thập thông tin: mỗi tuần một lần

Chọn một ngày cố định mỗi tuần và chuyển đến báo cáo lỗi thu thập thông tin của bạn. Khi chúng không xuất hiện vào tuần trước, bạn sẽ biết rằng bot gần đây đã gặp lỗi. Dưới đây là các lỗi có thể xảy ra trong báo cáo lỗi thu thập thông tin mỗi tuần một lần:

Lỗi 404 khi thu thập thông tin

Đây có lẽ là lỗi thu thập thông tin phổ biến nhất trên web và cũng là lỗi dễ sửa nhất. Chỉ cần nhấp vào lỗi thu thập thông tin trong báo cáo và một cửa sổ bật lên sẽ mở ra:

Lỗi 404 khi thu thập dữ liệu
Lỗi 404 khi thu thập dữ liệu

Xin lưu ý rằng thông tin trong tab “Được liên kết từ” không phải lúc nào cũng được cập nhật.

Lỗi 404 là do các liên kết bị hỏng từ các trang web khác

Nếu URL được liên kết từ một trang web khác, bạn chỉ cần thực hiện chuyển hướng 301 từ URL bị lỗi sang URL chính xác. Bạn có thể liên hệ với quản trị viên web và yêu cầu điều chỉnh, nhưng trong hầu hết các trường hợp, điều đó sẽ không quá quan trọng.

Lỗi 404 do liên kết nội bộ bị lỗi hoặc sơ đồ trang bị lỗi

Nếu một URL gây ra lỗi 404 cho Google bot được liên kết từ một trong các trang của riêng bạn hoặc từ một sơ đồ trang web, bạn nên sửa liên kết đó hoặc LIÊN KẾT trong sơ đồ trang web. Trong trường hợp này, bạn có thể sử dụng chuyển hướng 301 cho URL 404 đến URL mới được chỉnh sửa để sửa lỗi.

Lỗi 404 do Google thu thập dữ liệu JavaScript

Đôi khi bạn sẽ gặp lỗi 404 kỳ lạ trong Google Search Console, một số hoặc tất cả các trang của bạn liên kết đến. Khi bạn tìm kiếm các liên kết trong mã nguồn, bạn sẽ thấy rằng chúng thực sự là các URL tương đối được bao gồm trong các tập lệnh như sau:

Cách khắc phục lỗi thu thập dữ liệu google webmaster
Cách khắc phục lỗi thu thập dữ liệu google webmaster

Theo Google, đây hoàn toàn không phải là một vấn đề và loại lỗi 404 này có thể được bỏ qua.

Lỗi 404 bí ẩn

Trong một số trường hợp, nguồn gốc của liên kết vẫn còn là một bí ẩn. Dữ liệu Google cung cấp trong báo cáo lỗi thu thập thông tin không phải lúc nào cũng đáng tin cậy 100%. Ví dụ: thông tin trong tab “Được liên kết từ” không phải lúc nào cũng được cập nhật hoặc không được liên kết với các URL bị lỗi.

Hãy nhớ luôn đánh dấu tất cả các lỗi thu thập thông tin 404 mà bạn đã xử lý như đã sửa trong báo cáo lỗi thu thập thông tin. Nếu có lỗi thu thập thông tin 404 và bạn không biết phải làm gì, bạn vẫn có thể đánh dấu chúng là đã sửa và thu thập chúng trong danh sách của mình. Nếu chúng xuất hiện lại, thì bạn sẽ phải tìm hiểu sâu hơn về lỗi thực sự đó.

Bây giờ chúng ta hãy xem xét vấn đề lỗi “Soft 404”.

Lỗi “Soft 404” là gì?

Lỗi “Soft 404” là một trang trống mà bot của Google gặp phải và trả về mã 200.

Vì vậy, về cơ bản nó là một trang mà Google cho rằng phải là 404, nhưng không phải là một trang. Vào năm 2014, quản trị viên web bắt đầu nhận được lỗi “Soft 404” đối với một số trang có nội dung của họ. Đây là cách Google cho chúng tôi biết rằng bạn có ít nội dung hơn trên các trang của mình.

Xử lý lỗi “Soft 404” cũng đơn giản như xử lý lỗi 404 thông thường:

  • Nếu URL có lỗi “Soft 404” không tồn tại, nó cần chuyển hướng 301 đến một trang hiện có. Ngoài ra, hãy đảm bảo rằng bạn khắc phục sự cố một URL không tồn tại không trả về mã lỗi 404.
  • Nếu URL có lỗi “Soft 404” là một trong những trang có nội dung thực, điều này có nghĩa là Google sẽ coi nó như một trang có nội dung mỏng.
    Sau khi bạn đã sửa lỗi “Soft 404”, hãy nhớ đánh dấu tất cả chúng là đã sửa. Tiếp theo, chúng ta sẽ nói về lỗi máy chủ 500.

Lỗi máy chủ 500 và cách khắc phục

Lỗi máy chủ 500 có lẽ là loại lỗi thu thập thông tin duy nhất mà bạn có thể lo lắng. Nếu bot của Google thường xuyên gặp lỗi máy chủ trên trang của bạn, thì đây là một tín hiệu rất mạnh cho Google biết rằng trang của bạn có vấn đề gì đó và cuối cùng sẽ dẫn đến việc giảm thứ hạng tồi tệ.

Loại lỗi thu thập thông tin này có thể xuất hiện vì nhiều lý do. Đôi khi nó có thể là tên miền phụ, thư mục hoặc phần mở rộng tệp khiến máy chủ của bạn trả về mã trạng thái 500 thay vì 200. Nhà thiết kế trang web của bạn có thể khắc phục điều này nếu bạn gửi cho họ danh sách 500 URL bị cản trở gần đây từ Quản trị viên web của Google Công cụ.

Máy chủ có thể đã ngừng hoạt động một thời gian do bảo trì hoặc quá tải. Bạn có thể tìm thấy chúng bằng cách kiểm tra tệp nhật ký và liên hệ với nhà phát triển trang web của bạn. Trong những trường hợp như thế này, bạn nên cố gắng đảm bảo rằng sự cố như vậy sẽ không xảy ra nữa trong tương lai.

Chú ý đến lỗi máy chủ hiển thị trong Công cụ quản trị trang web của Google và cố gắng hạn chế chúng xuất hiện nhiều nhất có thể. Bot của Google sẽ luôn có thể truy cập lại các trang của bạn để loại bỏ lỗi này.

Hãy xem một số lỗi thu thập thông tin khác mà bạn có thể gặp phải trong Công cụ quản trị trang web của Google.

Lỗi tìm nạp: 400, 503, ..

Chúng tôi đã giải quyết các lỗi thu thập thông tin quan trọng và phổ biến nhất trong bài viết này: 404, Soft 404 và 500. Đôi khi, bạn có thể tìm thấy các loại lỗi thu thập thông tin khác, như 400, 503, “Truy cập bị từ chối”, “Chuyển hướng bị lỗi” (dành cho điện thoại thông minh ).

Nói chung, bạn nên xử lý bất kỳ loại lỗi thu thập thông tin nào mà bạn tìm thấy và cố gắng tránh nó xuất hiện lại trong tương lai. Càng ít lỗi thu thập dữ liệu mà Google bot gặp phải, Google càng tin tưởng trang web của bạn. Các trang liên tục gây ra lỗi thu thập thông tin sẽ được cho là cung cấp trải nghiệm người dùng kém và sẽ bị xếp hạng thấp hơn.

Bạn sẽ tìm thấy thêm thông tin về các loại lỗi thu thập thông tin khác nhau trong phần tiếp theo của bài viết này:

Danh sách các lỗi thu thập thông tin

Lỗi máy chủ 500

Trong báo cáo này, Google liệt kê các URL trả về lỗi 500 khi bot của Google cố gắng thu thập dữ liệu trang.

Mềm 404

Đây là những URL trả về mã trạng thái 200, nhưng sẽ trả về lỗi 400, theo Google.

Access Denied (403)

Tại đây, Google liệt kê tất cả các URL trả về lỗi 403 khi Google bot cố gắng thu thập dữ liệu chúng. Đảm bảo rằng bạn không liên kết đến các URL yêu cầu xác thực. Bạn có thể bỏ qua lỗi “Quyền truy cập bị từ chối” đối với các trang mà bạn đã đưa vào tệp robots.txt. Mặc dù vậy, bạn nên sử dụng liên kết nofollow khi liên kết đến các trang này để Google không thu thập thông tin chúng nhiều lần.

No Found (404/410)

“No Found” là lỗi 404 cơ bản.

No Followed (301)

Lỗi “No Followed”, là URL đã chuyển hướng đến một URL khác, nhưng chuyển hướng không thành công. Cần phải sửa những chuyển hướng này!

Lỗi 400/405/406

Vinahi khuyên bạn nên xử lý những lỗi này giống như bạn đối với lỗi 404 thông thường.

Flash Content (Smartphone)

Báo cáo này chỉ đơn giản là liệt kê các trang có nhiều nội dung flash hoạt động trên hầu hết các điện thoại thông minh. bạn nên loại bỏ nội dung flash!

Blocked (Smartphone)

Lỗi này đề cập đến các trang có thể được truy cập bởi bot của Google nhưng đã bị chặn đối với bot của Google di động trong tệp robot.txt của bạn. Đảm bảo rằng bạn cho phép tất cả các bot của Google truy cập vào nội dung bạn muốn lập chỉ mục!

Bài viết trên chúng tôi đã cung cấp thông tin đầy đủ về cách xử lý lỗi thu thập dữ liệu google webmaster, hãy cho Vinahi biết bằng cách để lại nhận xét bên dưới bài viết này. Cảm ơn bạn!

Nhận xét bài viết!