Google มันจัดอันดับยังไงกันแน่ ? จริงๆแล้วมันทำงานยังไงนะ ? ปัจจัยอะไรที่ ทำให้เว็บติดหน้าแรกๆได้ ? คำถามเหล่านี้ เป็นคำถามที่คนทำ SEO ทุกคนต้องสงสัยอย่างแน่นอน … เรามาฟังตัวจริงเสียงจริงอธิบายกันดีกว่า
คลิปข้างบนนี้ มาจากงาน SMX West 2016 ที่ตัดมาในส่วนของช่วงที่ว่า
“How Google Works” (Google ทำงานอย่างไร)
ในมุมมองของผู้ที่สร้างมัน นั่นก็คือ ทีมวิศวกรของ Google ที่เป็นคนเขียน CODE จัดอันดับเว็บไซต์ต่างๆ บน Google
โดยผู้ทรงคุณวุฒิที่ขึ้นพูด คือ ► Paul Haahr … Software Engineer ของ Google
(Paul Haahr เป็นตัวท็อป ของ Ranking Engineer Team ที่ทำงานอยู่กับ Google มากว่า 15 ปีแล้ว)
ด้านล่างนี้เป็น สไลด์ประกอบการบรรยาย ที่เค้าพูดครับ
สรุปประเด็นสำคัญๆอ้างอิงตามคลิปและสไลด์
ทิศทางของ Google Search ในปัจจุบัน
• Google Search ทุกวันนี้ ให้ความสำคัญกับการค้นหาผ่านมือถือ Mobile First
• Features ลูกเล่นต่างๆที่เกี่ยวข้องกับการค้นหาบนมือถือ
Google Search ทำงานอย่างไร
• Google Engineer Team เรียกหน้า Google ว่า “10 Blue Links”
• Google ให้ความสำคัญที่
1. จะแสดงผลอะไร
2. จะจัดอันดับสิ่งที่จะแสดงยังไง
• Google ทำงานแยกเป็น 2 ส่วนหลักๆ คือ ก่อนจัดอันดับ และ กระบวนการจัดอันดับ
1. Before the query:
- Crawl the web
- Analyze the crawl pages
– Extract links (the classic version of search)
– Render contents (Javascript, CSS – Paul emphasized the importance of this.)
– Annotate semantics - Build an index
– Link the index of a book
– For each word, a list of pages it appears on
– Broken up into millions of pages
These pages are called “shards”
1000s of shards for the web index
– Plus per-document metadata.
2. Query Processing (when someone uses search):
- Query understanding and expansion
– Does the query name known entities?
– Are there useful synonyms?
– Context matters - retrieval and scoring
– Send the query to all shards
– Each shard:
+ Finds matching pages
+ Computes a score for query+page
+ Sends back the top N pages by score
– Combine all the top pages
– Sort by score - Post retrieval adjustment
– Host clustering (how many pages are from the same domain), sitelinks
– Is there too much duplication?
– Spam demotions, manual actions applied
((ขออธิบายเพิ่มเติม))
• ช่วงก่อนจัด : Crawl เว็บ + วิเคราะห์ + เอาข้อมูลมาจัดเก็บเป็นดัชนี (Indexing)
• โดยการจัดทำดัชนีเว็บ Google แบ่งกลุ่มของหน้าเว็บที่มีล้านๆ ออกเป็นกลุ่มๆ เป็นพันๆกลุ่ม เรียกว่า “Shards”
• ในกระบวนการจัดอันดับ (Query Processing) จะแบ่งเป็น 3 ขั้นตอน คือ
1. ทำความเข้าใจคำค้นหาและส่วนขยาย (Query Understanding)
2. ดึงข้อมูลแล้วมาให้คะแนน (Retrieval and Scoring)
3. ตรวจสอบและปรับปรุง (Post-retrieval adjustments)
• ในขั้นตอนการให้คะแนน Google จะส่งคำค้นหาไปทุกๆ Shards แล้วแต่ละ Shard จะค้นหาหน้าเพจ .. จากนั้นจะคำนวณคะแนนแล้วส่งข้อมูลกลับมาเป็น Top-pages ที่เรียงตามคำแนน
• แล้ว Google จึงนำข้อมูลคะแนน จากทุก Shards มารวมๆกันแล้ว มาจัดอันดับเรียงตามคะแนนอีกที
• เมื่อ Google ได้อันดับจากหน้า Page จากทุกๆ Shards รวมกันแล้ว ก็จะนำมาผ่านกระบวนการตรวจสอบ เพื่อมากรองและปรับเปลี่ยนอันดับจริง อีกครั้ง … เช่น
– Host clustering (domain ที่อยู่ใน Host กลุ่มเดียวกัน)
– นำเว็บมาจัดทำ Sitelinks
– ตรวจสอบดูว่ามีหน้าที่ซ้ำๆ หรือ มีเนื้อหาที่ซ้ำกับเว็บอื่นๆเยอะมั้ย
– ตรวจสอบ Spam / Hacked / สิ่งต่างๆที่ผิดกฎของ Google
Google Ranking Engineer ทำหน้าที่อะไร
• ทีมงาน Google Ranking Engineer ประกอบด้วย วิศวกรคอมพิวเตอร์ หลายร้อยชีวิต ที่รวมตัวกันทำงานโดยมุ่งเน้นไปที่ตัวชี้วัดและสัญญาณ เพื่อนำมาใช้ในการจัดอันดับเว็บไซต์
• หน้าที่ของ Google Ranking Engineer แบ่งเป็น
1. เขียน Code สำหรับเซิฟเว่อร์ (เขียน Algorithm นั่นเอง)
2. ค้นหาสัญญาณใหม่ๆมาจัดอันดับ รวมถึงพยายามรวมสัญญาณเก่าๆในรูปแบบใหม่
3. เพิ่มประสิทธิภาพให้กับตัวชี้วัด (Metrics)
4. ทำหน้าที่เลื่อนอันดับขึ้น (และลง) ให้กับหน้าเว็บตามคะแนนอิงตามตัวชี้วัด
5. จัดทำ Rater Guideline หรือ พัฒนาตัวชี้วัดใหม่ๆ (หากจำเป็น)
((ขออธิบายเพิ่มเติม))
#1 ในส่วนของการเขียน Code (Google Algorithm) จะใช้ Scoring Signal เพื่อมาจับคู่ (Matching) ระหว่าง Query (คำค้นหา) กับ หน้าเว็บต่างๆ โดยทาง Ranking Engineer จะแบ่งออกเป็น 2 หมวดหมู่ คือ
1. สัญญาณที่อิงจากหน้า Page : เช่น PageRank, language, mobile friendliness ..
2. สัญญาณที่อิงจาก Query (คำค้นหา) : เช่น Keyword hits, synonyms, proximity ..
#2 ในส่วนของการค้นหาสัญญาณใหม่ๆเพื่อมาใช้เป็นตัวชี้วัด สำหรับเอาไปเป็น Scoring Signal ทีมงานให้ความสำคัญหลายด้าน อาทิเช่น
Relevance – ความสอดคล้องของการจัดอันดับ กับ คำค้นหา
Quality – คุณภาพของการแสดงผลอันดับที่จัด
Speed – ความเร็วในการจัดอันดับ
Higher results matter – ให้ความสำคัญกับอันดับที่อยู่สูงๆมากเป็นพิเศษ
#3 เพิ่มประสิทธิภาพให้กับตัวชี้วัดให้ดียิ่งขึ้น โดยตัวชี้วัดที่ว่า มาจาก 2 ส่วน
1. การทดลองจากทีมงาน Engineer เอง (Live Experiments)
ทีมงานทดลองกันเยอะมาก (เยอะขนาดที่คุณคาดไม่ถึงทีเดียวเชียว) เพื่อพัฒนา Google ให้ดียิ่งขึ้น
2. การทดลองจากทีมผู้ประเมินคุณภาพหน้าเว็บ (Human Rater Experiments)
ถ้าใครยังไม่รู้ว่า ผู้ประเมินคุณภาพหน้าเว็บ (Human Rater) คืออะไร
ให้อ่านบทความ รู้จักกับ ► Google Quality Raters (Human Rater)
#4 กล่าวโดยสรุปให้เข้าใจง่ายๆ หน้าที่ของ Ranking Engineer ก็คือ ผู้ที่ทำให้อันดับขึ้น-ลง ของหน้าเว็บบน Google นั่นเอง โดยอาศัยตัวชี้วัดทั้งหลาย ที่ผ่านกระบวนการต่างๆ ผ่านการทดลอง ผ่านการทดสอบ กลั่นกรองและตรวจสอบ อย่างมากมาย … เอามาเป็นตัวตัดสิน
#5 สุดท้ายเมื่อกรณีเกิดข้อผิดพลาด ทีมงานก็พยายามปรับปรุงแก้ไข แล้วนำมา อัพเดทในคู่มือ เพื่อกำหนดรูปแบบให้กับ Human Rater เอามาปรับใช้ในการให้คะแนนหน้าเพจ นั่นเอง
……………………………………………………………
งงอ่ะดิ !!! (เค้ารู้ 555+ ไม่ต้องทำหน้าแบบนั้น)
เอาขอสรุปสั้นๆ (สไตล์ คนทำเว็บนอกคอก) ให้หนูหน่อย
……………………………………………………………..
สรุปจากคลิปที่ยาวกว่า 30 นาทีนี้ กับสไลด์เกือบ 70 หน้า สั้นๆได้ว่า
“If you’re wondering why Google is doing something, often the answer is to make it [search] look more like what the rater guidelines say.”
นี่เป็นคำกล่าว ของ Paul Haahr, Google Ranking Engineer, ที่พูดไว้ในงาน SMX West 2016
แปลเป็นไทย ประมาณว่า …
ถ้าคุณสงสัยว่า Google กำลังทำอะไรอยู่ ไปหาคำตอบได้ในคู่มือ Search Quality Evaluators Guidelines !! (น่ะ)
ดังนั้นคนทำ SEO ไปอ่านแล้วทำความเข้าใจกันนะครับ ถ้าคุณอยากเข้าใจ Google ให้มากขึ้นว่ามัน ทำงานอย่างไร !!
Download ► Google Quality Rater Guideline 2014 (March 31, 2014)
Download ► Google Quality Rater Guideline 2015 (November 12, 2015)
Download ► Search Quality Evaluators Guideline 2017 (May 11, 2017)
JoJho
คนทำเว็บนอกคอก
ถ้าไม่อยากอ่านฉบับเต็มๆ ผมเขียนสรุปประเด็นสำคัญๆของ Rater Guidelines
เป็นภาษาไทยไว้ แบบคร่าวๆ (เมื่อ 2 ปีก่อน) ► ลองอ่านดูครับ