Phân tích SEO và thống kê dữ liệu website bằng AWStats

Chào các bạn, trong bài viết mới này mình muốn đề cập đến một vấn đề mà từ lâu khi làm SEO mình đã gặp phải, nó liên quan trực tiếp đến số liệu thống kê Analytics của Google. Đã bao giờ bạn tự hỏi các câu hỏi sau đây chưa:

1. Tôi là một người làm SEO chuyên nghiệp, tôi không chỉ SEO trên bộ máy tìm kiếm là Google, tôi còn SEO trên các bộ máy tìm kiếm khác là Yahoo và Bing, làm thế nào để biết 2 bộ máy tìm kiếm này truy suất vào website của tôi bao nhiêu lần?
2. Tôi đang thực hiện chiến dịch quảng cáo và có mua một số bài viết của đối tác, tôi có đính kèm các tài liệu giới thiệu dịch vụ, làm thế nào để tôi biết được tài liệu này có bao nhiêu lần tải?
3. Website của tôi đang hoạt động ổn định, nhưng vừa rồi tôi có thay đổi giao diện, tôi có cập nhật một số tính năng nhưng không chắc nó đã hoạt động tốt. Liệu có xuất hiện các thông báo 206, 301, 302, 404, 401, 500,… không ? Và xuất hiện bao nhiêu lần trên website của tôi?
4. Và cuối cùng tôi tự hỏi bản thân mình một điều là Google Analytics có giải đáp hết những câu hỏi bên trên của tôi không?

Bên trên là một trong những câu hỏi mà trước đây mỗi ngày mình nhìn vào thống kê của Google để tự hỏi, nhưng rốt cuộc mình chẳng tìm thấy gì ở đó cả. Nhưng không vì thế mà mình tự ngừng hỏi bản thân mình, mà để đơn giản hóa vấn đề mình đã đặt ra một câu hỏi là có cách nào để biết những điều trên hay không? Mình đã tự trả lời câu hỏi này bằng cách kiểm tra Logs của Website, và thế là mình đã tìm ra công cụ để trả lời câu hỏi này.

Mình xin giới thiệu với các bạn SEOer và Webmaster công cụ mang tên AWStats, rất phổ biến và miễn phí, đã được cài đặt trên rất nhiều máy chủ. Trong bài viết này, Mần SEO sẽ demo công cụ này trên cPanel.

awstats_logo

Để bắt đầu bạn cần đăng nhập vào cPanel, rồi click vào biểu tượng AWStats như hình bên dưới, sau đó chọn domain cần xem.

awstats_logs

Nếu tài khoản của bạn không thấy biểu tượng này, bạn cần liên hệ với nhà cung cấp dịch vụ để họ mở cho bạn. Hoặc nếu bạn chạy server riêng nhưng không thấy thì hãy đăng nhập vào WHM > Server Configuration > Statistics Software Configuration để kích hoạt tính năng này.

awstats_main

Hình bên trên đây là tổng quan giao diện của AWStats, với các con số thống kê bao gồm traffic, visit, hits, bandwidth,… rất chi tiết. Những con số bên trên đây thể hiện quá trình phát triển của website từng ngày, các con số này đảm bảo độ chính xác tuyệt đối vì nó là Logs, mà đã là Logs thì không có chuyện giả mạo hay sai lệch được. Mình ví dụ trường hợp rất kinh điển đó là việc các Hacker khi tấn công vào hệ thống, họ đều xóa Logs truy cập để tránh bị phát hiện, bởi vì qua Logs nó đã mô tả quá trình thực thi của họ.

Để trải nghiệm rõ hơn về AWStats, bạn truy cập vào địa chỉ này: http://www.nltechno.com/awstats/awstats.pl?config=destailleur.fr

I. Thống kê truy cập.

Thống kê truy cập theo giờ, ngày, tháng. Hình bên dưới đây là biểu đồ thể hiện truy cập theo từng giờ, kèm theo là lượng băng thông mà máy chủ xử lý.

awstats_hours

Thống kê truy cập từ các quốc gia, ip nào truy suất nhiều nhất, để có cái nhìn tổng quan bạn bấm vào chữ Full List. Tại đây có một mẹo nhỏ bạn có thể kiểm tra xem ip nào truy suất vào website mình nhiều nhất, với truy cập bình thường họ không request quá nhiều nên số Hits vừa phải. Còn những IP nào với ý đồ DOS (tấn công từ chối dịch vụ) sẽ request liên tục, cần phải chặn ngay nếu không muốn mất băng thông vô ích. Hình bên dưới bạn sẽ thấy IP 78.224.121.19 từ Pháp request rất lớn, nếu chúng ta đang SEO trên Google.com.vn mà IP từ Pháp truy cập với cường độ cao như vậy phải xem xét lại.

awstats_geoip

II. Robots, Spider, Time on Site.

Thống kê truy cập vào vập tin robots.txt của các bộ máy tìm kiếm bao nhiêu lần, qua đó xuất ra băng thông mà máy chủ đã xử lý.

awstats_robots

Mình quay trở lại câu hỏi số 1 như sau: Tôi là một người làm SEO chuyên nghiệp, tôi không chỉ SEO trên bộ máy tìm kiếm là Google, tôi còn SEO trên các bộ máy tìm kiếm khác là Yahoo và Bing, làm thế nào để biết 2 bộ máy tìm kiếm này truy suất vào website của tôi bao nhiêu lần?

Ảnh chụp bên trên nhìn vào khá rõ các bộ tìm kiếm, ví dụ đầu tiên là Yahoo, Googlebot, MSNBot và có cả Alexa nữa (không có Bingbot bởi vì phiên bản AWStats trên server mình khá cũ nên nó chưa hiểu được). Còn đây ảnh chụp trên Google Analytics, không thấy show ra kết quả từ bộ máy tìm kiếm Yahoo, chỉ thấy có traffic từ hòm mail yahoo mà thôi.

google_analytics_manseo

III. Tập tin và số lần truy suất.

Thống kê số lần truy cập các tập tin như png, js, css, jpg, pdf, zip,… bao nhiêu lần tải về, tải về thất bại bao nhiêu lần, cũng như băng thông. Trong phần này, mình sẽ phân tích câu hỏi số 2: Tôi đang thực hiện chiến dịch quảng cáo và có mua một số bài viết của đối tác, tôi có đính kèm các tài liệu giới thiệu dịch vụ, làm thế nào để tôi biết được tài liệu này có bao nhiêu lần tải?

awstats_file

Trước đây, mình có viết bài viết Ahrefs cập nhật New Index 5.0 cùng nhiều cải tiến khác mình có đính kèm 1 tập tin ahrefs_www.manseo.com_.pdf tại đây mình có thể thấy rất rõ hành vi của khách truy cập. Như bạn thấy tập tin này có 40 (Hits) và 17 (206 Hits), phân tích trạng thái như sau:

40 lần tải tập tin ahrefs_www.manseo.com_.pdf

Chú ý: Hiện tại AWStats đang thống kê vào tháng 10/2013, các dữ liệu rơi vào các tháng trước đó nên tính tổng lại để dễ thống kê.

IV. Trình duyệt và mã trạng thái máy chủ.

Tại đây AWStats sẽ thống kê trình duyệt hỗ trợ Java, Flash, Audio,… truy cập vào website của bạn bao nhiêu. Phần này nói chung không quan trọng lắm, vì hầu như hiện nay đa số trình duyệt đã hỗ trợ các tính năng bên dưới.

HTTP Status codes: thống kê các mã trạng thái máy chủ, cái này rất phổ biến có rất nhiều bài viết như thông báo 404, chuyển hướng URL 301, 302, Mần SEO cũng có 1 bài là Redesign website và SEO, những điều cần lưu ý bạn có thể tham khảo thêm.

awstats_http

Mình quay trở lại câu hỏi số 3: Website của tôi đang hoạt động ổn định, nhưng vừa rồi tôi có thay đổi giao diện, tôi có cập nhật một số tính năng nhưng không chắc nó đã hoạt động tốt. Liệu có xuất hiện các thông báo 206, 301, 302, 404, 401, 500,… không ? Và xuất hiện bao nhiêu lần trên website của tôi?
Nhìn hình bên trên bạn có thể thấy rất rõ:

21,258 Hits chuyển hướng 301 vĩnh viễn.
2,444 Hits chuyển hướng 302 tạm thời.
8,703 Hits thông báo lỗi không tìm thấy 404.
36 Hits thông báo lỗi máy chủ Internal server Error.

Bạn có thể tham khảo thêm tài liệu về mã trạng thái máy chủ cũng như thuật ngữ tại đây: http://awstats.sourceforge.net/docs/awstats_glossary.html

Mình tiến hành phân tích để sửa các lỗi 404 không tìm thấy trên Mần SEO.

awstats_404

Mình đã đánh dấu khoanh đỏ các vùng để giải thích, cột bên trái URL chứa tập tin không tìm thấy, cột bên phải là Referrers thể hiện nguồn truy suất tới. Giải thích đơn giản là:

Nguồn: http://forum.idichvuseo.com/threads/ahrefs-com-cong-cu-phan-tich-lien-ket-ua-thich-cua-gioi-seo.21298/
404: /wp-content/uploads/2013/07/newlost-1024x559.png
Số lần gọi tới là 135 lần.

Mình cũng ví dụ luôn trường hợp 404 không tìm thấy ở bài viết Thủ thuật xây dựng liên kết Dofollow trên mã nguồn vBulletin và phương pháp phòng chống tại đây bạn chú ý nhìn cuối bài viết sẽ thấy 3 cái demo, chỉ có Demo 1 là thành công còn lại Demo 2 và Demo 3 xảy ra lỗi 404.

Demo 2 với URL: /khong-lam-seo-thi-man-seo.html&&&&&&&
Có 51 thông báo 404 không tìm thấy ở trường hợp này.

Demo 3 với URL: /khong-lam-seo-thi-man-seo.html$$$$$$$
Có 29 thông báo 404 không tìm thấy ở trường hợp này.

Qua bài viết này, mình muốn gửi đến các bạn làm SEO một cái nhìn tổng quan về thống kê dữ liệu. Có thêm công cụ để phân tích thì mình có thể dễ dàng tìm ra lỗi hệ thống, hoặc tính toán giá trị chuyển đổi tốt hơn.

Mr.N2Mần SEO

Tags:
Hãy biết đam mê và mãi mãi khát khao học hỏi.
Loading Facebook Comments ...

1 Comment

  1. Bổ sung thêm về cách bật trên BLUE host. Để bật chức năng AWStats các bạn vào mục STATISTICS –> choose starts và tick vào domain cần theo dõi. dữ liệu sẽ có sau 24h.

Leave a Reply

Your email address will not be published.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">

*