Search Engine Journal הוא מגזין דיגיטלי לתחום קידום האתרים בכלל ו- SEO בפרט ולרוב אני מוצא בכתבות שלהן ככתבות סופר מעניינות.
לפני כחודשיים הם פרסמו חדשות מרעישות:
מרכז החיפוש של גוגל פרסם מסמך מעודכן בו גוגל בוט מסתמך רק על 15 המגה בייט של תוכן ה- HTML של כל עמוד באתר האינטרנט שלך, לצורך דירוג האתר בגוגל.
הדבר יצר הד בקהילת מקדמי ה- SEO ותהיות מה זה אומר בתכלס', האם אתר אינטרנט שמתחיל נגיד ב- 10 תמונות השוקלות מעל 15MB שאחריו ישנו תוכן, ימנע מהתוכן להיסרק?
ג'ון מילר ענה על זה שתמונות שנמצאות בתוך תג IMG לא כלולות כחלק ממשקל ה- HTML, ולכן אין זה מפריע לסרוק את שאר תוכן ה- HTML'י של העמוד:
למעשה מעבר לכך שג'ון מילר ענה שמדובר רק על 15MB הראשונים של תוכן ה- HTML בלבד, ללא משאבים חיצונים / נוספים וכו', הוא גם הגיב במקום אחר בטוויטר לידיעה "החדשותית" של Search Engine Journal ואמר שבכלל לא בדובר במשהו חדש, אלא שכבר מ- 2017 התפרסמה ידיעה בנושא:
מה גודל הקובץ המקסימלי שגוגל יכולה לאנדקס?
במחקר שבוצעה על ידי ICG – Strategic Marketing Agency (סוכנות שיווק בבריטניה, זוכת פרסים ועם למעלה מ- 25 שנות ניסיון) באוגסוט 2017, החקר מה גודל הקובץ המקסימלי שגוגל מאנדקסת נמצא כי גוגל מאנדקסת 15.7MB מעמוד HTML, כאשר בגוגל Inspect (במחקר דובר על כלי fetch as Google – ויכול להיות שדברים ישתנו מאז) מתקבלים רק 250KB הראשונים ובגוגל Cache – גוגל שומרת רק 1MB של האתר.
בגוגל קאש (Cache) אני לא יודע אם הכוונה לגרסת הטקסט בלבד, או גרסת המטמון המלאה או גם וגם, בכל מקרה כאשר רואים בעיות מוזרות בגרסת הקאש באתר, שווה לבדוק מה גודל עמוד ה- HTML שלך כי יכול להיות שאין כל בעיה איתו, הוא פשוט גדול מידי כדי להיות מאוחסן בגרסת הקאש של גוגל.
החשיבות בלדעת את גודל עמוד האתר שגוגל שומרת
על פניו 15 מגה ורק עבור תוכן ה- HTML של האתר, זה הרבה מאוד, ונדיר למצוא אתרי אינטרנט שמגיעים לכזה גודל, שכן אפילו התמונות (בתג IMG) לא נכנסות לחישוב זה. אז אם כך מדוע זה חשוב לנו לדעת זאת?
פשוט מאוד, ראשית חשוב שנפנים שגם אצל גוגל, כמות המידע שיכול להיות מאוחסן – מוגבל. שנית הדבר מעביר לנו את העיקרון מדוע גוגל פועלת בדרך בה היא פועלת (מדדי מהירות, ותקציב זחילה) ומדגיש עבורנו את העיקרון של התמקדות בעיקר + שלפעמים חדשות הם לא תמיד חדשות, רק צריך לדעת איפה לחפש.
"מיקומי אתר האינטרנט שלי בירידה ואני לא יודע מה מקור הבעיה"
הזכרתי קודם שגוגל מאחסנת 1MB קאש של אתר האינטרנט שלך, ואולי זה זמן טוב ללמד איך באמת עושים בו שימוש לצורך בדיקת האתר מהעיניים של גוגל.
בכל פעם שפונים אליי ואומרים לי שמיקומי האתר בירידה, ואין להם מושג מה מקור הבעיה, הדבר הראשון ממנו אני מתחיל זה בגרסת הטקסט של העמוד המדובר, השמורה בתור קאש' אצל גוגל.
אני עושה השוואה בינה לבין העמוד המדובר החי באתר הלקוח, ובודק האם גוגל מצליח לקרוא בה הכל ובצורה טובה.
גוגל Cache גרסת הטקסט בלבד
גרסת הטקסט בלבד בגוגל Cache היא גרסה כשמה כן היא, של טקסט בלבד. ללא תמונות, ללא וידאו, ללא js, וכיוצא מזה.
אני משוואה בין הטקסט בה לטקסט של האתר החי, ואם יש שוני אני מבין שיש לנו בעיה ומתחיל לעמיק בלמה. אם אין שוני והכל עובד כפי שצריך – אני לפחות יודע שיש לעשות את בדיקת האתר על מאפיינים אחרים.
אם גם האתר שלך צריך בדיקה לצורך קידום אורגני של האתר, אז כדאי ליצור קשר איתי, המפקח, ונמשיך משם.