תשובה: האם יש עוד שפות מעל או מתחת לקו המשווה?


גוגלר דניאל ראסל יודע למצוא את התשובות לשאלות שאי אפשר להגיע אליהן בעזרת שאילתה פשוטה של ​​גוגל. בעמודה השבועית שלו מחקר חיפוש, ראסל מציב אתגר חיפוש, ולאחר מכן עוקב בהמשך השבוע עם הפתרון שלו - תוך שימוש בכל טכנולוגיית חיפוש ומתודולוגיה שמתאימות לחשבון. אתגר השבוע:האם יש עוד שפות מעל או מתחת לקו המשווה?

השאלה הייתה:

האם יש עוד שפות מעל קו המשווה או מתחת לקו המשווה?

כפי שאמרתי, חלק גדול במתן מענה לשאלות כאלה הוא להבהיר את התנאים שלך מאוד. כשאנחנו מחליטים לשקול רק שפות "רשמיות", ולא, נניח, כל שפה קטנה המדוברת בגינאה החדשה (שיש בה אלפים) או כל שפה המדוברת במרכז אפריקה (יותר אלפים), אנחנו באמת מפשטים את הבעיה.

מה שזה מאפשר לנו לעשות הוא לחפש רשימה של "שפות רשמיות". אז רק חיפוש כמו [שפות רשמיות] מוביל במהירות ל-דף ויקיפדיה של השפות הרשמיות. וזה לא מקום רע להתחיל בו.

אבל בהסתכלות מסביב גיליתי שחיפוש מוביל גם ל-טבלת שפות לפי מדינה ב-Infopleaseעם אותם נתונים פחות או יותר בצורה קצת יותר נוחה. (חיפוש נוסף שעובד היה [רשימת שפות לפי מדינה].)

אז עכשיו יש לי אטבלה מ-Infopleaseשנראה כך:

כדי להמיר אותו לטופס שנוכל לעשות בו מניפולציות, פשוט העתקתי את הטקסט של הטבלה ושמרתי אותו בקובץ טקסט רגיל. באופן שימושי, העתק/הדבק לקובץ מכניס אוטומטית TABs בין העמודות. זה יקל על היבוא לגיליון אלקטרוני.

עכשיו אני צריך להבין לאילו מהמדינות האלה יש את בירתם בחצי הכדור הצפוני. אז עשיתי חיפוש אחר [ בירות מדינות latlong ] ומצאתיעוד שולחן שימושישל בירות מדינות עם ה-lat-longs הקשורים אליהן!

עשיתי את ההעתקה/הדבקה כדי להעביר את הנתונים האלה מדף האינטרנט שלהם לקובץ הטקסט הפשוט שלי. לאחר מכן ייבאתי את זה לגיליון אלקטרוני אחר.

עכשיו יש לי שני גיליונות אלקטרוניים, אחד עם רשימה של שפות לפי ארץ, ואחר עם בירות מדינות ואורך האורך שלהן.

מהגיליון האלקטרוני של Lang-by-country אני יכול בקלות לכתוב פונקציית גיליון אלקטרוני כדי לספור את מספר השפות בכל מדינה.

שורה טיפוסית נראית כך:

אפגניסטן, דארי (פרסית), פשטו (שתיהן רשמיות), שפות טורקיות אחרות ושפות משניות

199 השפות של כל מדינה בטבלה זו מופרדות בפסיקים. אז, אני כותב פונקציה קצרה של גיליון אלקטרוני כדי לספור פסיקים בכל שורה, ו-וואילה!-יש לי טבלה של מדינה / מספר-שפות. (אני שמח לתת לביטוי "...שפות טורקיות אחרות ושפות משניות" להיחשב כשפה נוספת אחת. אתה תראה שזה לא ישנה בסופו של דבר.) בשיטה זו, אני רואה שלאפגניסטן יש 3 שפות. כן, יש אחרות, אבל יש רק 2 שפות רשמיות (והרבה שפות לא רשמיות).

בגיליון האלקטרוני האחר שלי יש לי טבלה של 200 מדינה / בירה / אורך רוחב.

ברור שמה שאני רוצה לעשות זה להשתמש ב-Lat-longs כדי לקבוע אם המדינה נמצאת מעל או מתחת לקו המשווה, ואז פשוט לספור את מספר השפות בכל קבוצה.

זה בדיוק מהGoogle Fusion Tablesנועדו לעשות.

טבלת Fusion יכולה לקחת שתי טבלאות שונות שחולקות אלמנט משותף (במקרה זה, העמודה שכותרתה "מדינה") ולחבר אותן יחד. זה 200 פעולות העתק/הדבק שלא אצטרך לעשות ביד.

יצרתי שני טבלאות Fusion, אחת לכל אחד משני הגיליונות האלקטרוניים שלי. באמצעות פונקציית "מיזוג" של טבלאות Fusion, פשוט חיברתי אותם יחד בעמודה המשותפת שלהם "מדינה".

פתחתי את הטבלה Country-LatLong ואז התמזגתי אותה עם הטבלה Country-Latong-Count. זה בעצם ממזג את שתי הטבלאות כך שיש לי עכשיו טבלה חדשה עם עמודות עבור מדינה / אורך רוחב / מספר שפות!

ברגע שיש לי את זה, זה סוג קל של הטבלה לשים את כל המדינות מעל קו המשווה (כלומר, Lat-long שלהם מכיל "N" בערך), ולאחר מכן לכתוב פונקציה פשוטה = SUM(…) כדי להוסיף את כולם.

כך נראה השולחן שלי עכשיו. המרתי את הנוכחות/היעדר של "N" ב-lat-long ל-1 (עבור מעל) או 0 (עבור מתחת).

ועכשיו אנחנו יכולים פשוט לקרוא את התשובה: ישנן 546 שפות רשמיות המדוברות מעל קו המשווה, אך רק 164 מדוברות מתחת. זה הבדל גדול.

אני אשאיר לך לשער למה זה. אבל לפחות יש לנו קצת נתונים להמשיך.

ומכיוון שהייתי ב-Fusion Tables, זה היה טריוויאלי לדמיין את הנתונים על ידי מיפוי מספר השפות על מפת העולם וליצור את המפה הזו. ככל שהירוק כהה יותר, כך מדברים שם יותר שפות. כפי שאתה יכול לראות, בצפון יש הרבה יותר מאשר בדרום.

חיפוש שיעור:לעתים קרובות תגלה שהנתונים נמצאים בחוץ באינטרנט, אבל הם בצורה לא שימושית. במקרה זה, המידע שרצינו לא היה זמין באופן מיידי. אבל עם חילוץ נתונים קטן, הפעלת גיליונות אלקטרוניים ושימוש ב- Fusion Tables למיזוג שני מערכי נתונים, נוכל להגיע למה שאנחנו רוצים די מהר.

פקח עיניים לאפשרויות מיזוג נתונים אלה. ברגע שתתחיל להסתכל מסביב, תראה כל מיני מיזוגים שמובילים לתובנות על העולם.

אתגר החיפוש של יום רביעי (21/3/12): האם יש עוד שפות מעל או מתחת לקו המשווה?| SearchReSearch


דניאל מ' ראסל חוקר את הדרך שבה אנשים מחפשים וחוקרים - אנתרופולוג של חיפוש, אם תרצו. אתה יכול לקרוא עוד מראסל על שלוהבלוג SearchReSearch, והישארו מעודכנים לגבי האתגרים (והתשובות) השבועיות שלו כאן ב-Lifehacker.

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.