איך לאמן את הרשת העצבית שלך

תמונה זו נוצרה על ידי אדם אמיתי. אני חושב.קרדיט: סם וולי

נראה שבינה מלאכותית (AI) מוכנה לנהל את רוב העולם בימים אלה: זה כןזיהוי סרטן העור, מחפשדברי שטנה בפייסבוק, ואפילוסימון שקרים אפשריים בדוחות המשטרה בספרד. אבל לא כולם מנוהלים על ידי מגה-תאגידים וממשלות; אתה יכול להוריד כמה אלגוריתמים ולשחק איתם בעצמך, עם תוצאות מצחיקות לעתים קרובות.

יש אתפוסטר מזויף של Coachella מלא בשמות מזויפים של להקות, נוצר על ידי הזנת חבורה של שמות להקות אמיתיות לרשת נוירונים ובקשת ממנה להמציא כמה משלה. יש אתמתכונים שנוצרו בצורה דומה, שבו "ביף ברביקיו" דורש "בירה אחת - חתוכה לקוביות". ואז יש את האהובה עליי, של ג'אנל שייןצבעי צבע שנוצרו על ידי AI(תייג את עצמך, אני דורקווד).

כל אלה נעשו עםרשתות עצביות, סוג של בינה מלאכותית המבוססת על הטבע דמוי הרשת של המוח שלנו. אתה מאמן רשת עצבית על ידי מתן קלט: מתכונים, למשל. הרשת מחזקת חלק מהקשרים בין הנוירונים שלה (חיקוי תאי מוח) יותר מאחרים כשהיא לומדת. הרעיון הוא שזה להבין את הכללים של איך הקלט עובד: אילו אותיות נוטות לעקוב אחר אחרות, למשל. לאחר שהרשת מאומנת, אתה יכול לבקש ממנה לייצר פלט משלה, או לתת לה קלט חלקי ולבקש ממנה למלא את השאר.

אבל המחשב בעצם לא מבין את הכללים של, למשל, הכנת מתכונים. היא יודעת שבירה יכולה להיות מרכיב, ושאפשר לחתוך דברים לקוביות, אבל אף אחד מעולם לא אמר לה שבירה היא לא אחד מהדברים האלה. הפלטים שנראים כמעט נכונים, אבל לא מבינים כלל יסוד כלשהו, הם לרוב המצחיקים ביותר.

שמחתי פשוט לצפות בתעלולים האלה מרחוק, עד ששיין הזכיר בטוויטר שיש לכיתת קידוד בחטיבת הבינייםיצר שמות גלידה טובים יותרממה שהיה לה. וחשבתי, אםילדיםיכול לעשות את זה, אני יכול לעשות את זה.

איך לאמן את הרשת העצבית הראשונה שלך

התחלתי עם אותו ערכת כלים ששיין השתמש בו לטעמי גלידה: מודול פיתון שנקראtextgenrnn, מאת מקס וולף מבאזפיד. תצטרך אידע בסיסי בשורת הפקודהלעבוד איתו, אבל זה עובד בכל מערכת (Mac, Linux, Windows) שבה התקנת את שפת התכנות/מתורגמןפִּיתוֹן.

לפני שתוכל לאמן את הרשת העצבית שלך, תצטרך קצת קלט מלכתחילה. כיתת חטיבת הביניים התחילה עם רשימה של אלפי טעמי גלידה, למשל. לא משנה מה תבחר, תרצה לפחות כמה מאות דוגמאות; אלפים יהיה טוב יותר. אולי תרצההורד את כל הציוצים שלך, ובקש מהרשת ליצור לך כמה ציוצים חדשים. או בדוקרשימת רשימות הרשימות של ויקיפדיהלרעיונות.

לא משנה מה תבחר, הכנס אותו לקובץ טקסט עם פריט אחד בכל שורה. זה עשוי לקחת קצת עבודה יצירתית של העתקה והדבקה או גיליון אלקטרוני, או אם אתה מיושן בקידוד, אתה יכול לכתוב כמה סקריפטים מכוערים של perl כדי לשלב את הנתונים להגשה. אני בחורה מכוערת של תסריט פרל, אבל כשבסופו של דבר רציתי כותרות של Lifehacker לאחד ממערכי הנתונים שלי, פשוט ביקשתי צוות הניתוח שלנו רשימה גדולה של כותרות והם שלחו לי בדיוק את מה שאני צריך. לבקש יפה היא מיומנות קידוד לא מוערכת.

(אם תרצה להזין כותרות של Lifehacker ברשת העצבית שלך,הנה הרשימה הזו. זה בערך 10,000 מהם.)

צור תיקיה עבור הפרויקט החדש שלך, וכתוב שני סקריפטים. ראשית, אחד שנקרא train.py:

from textgenrnn import textgenrnn
t = textgenrnn()
t.train_from_file(‘input.txt’, num_epochs=5)

סקריפט זה יגרום לרשת העצבית לקרוא את הקלט שלך ולחשוב על החוקים שלו. לסקריפט יש כמה דברים שאתה יכול לשנות:

t = textgenrnn()זה בסדר בפעם הראשונה שאתה מפעיל את הסקריפט, אבל אם תרצה לחזור אליו מאוחר יותר, הזן את שם קובץ ה-.hdf5 שהופיע באופן קסום בתיקייה כשהרצת אותו. במקרה כזה, השורה צריכה להיראות כך:t=textgenrnn(‘textgenrnn_weights.hdf5’)
‘input.txt’הוא שם הקובץ שלך עם כותרת/מתכון/ציוץ/וכו' אחת בכל שורה.
num_epochsהוא כמה פעמים תרצה לעבד את הקובץ. הרשת העצבית משתפרת ככל שאתה נותן לה ללמוד יותר זמן, אז התחל עם 2 או 5 כדי לראות כמה זמן זה לוקח, ואז עלה משם.

לוקח זמן לאמן את הרשת. אם אתה מפעיל את הסקריפטים שלך במחשב נייד, תקופה אחת עשויה להימשך 10 או 15 דקות (מערכי נתונים גדולים יותר יידרשו זמן רב יותר). אם יש לך גישה לשולחן עבודה בשרני, אולי למחשב המשחקים שלך או של חבר, הדברים ילכו מהר יותר. אם יש לך מערך נתונים גדול, אולי תרצה לבקש ממנו כמה עשרות או אפילו מאות עידנים, ולתת לו לפעול בן לילה.

לאחר מכן, כתוב סקריפט אחר בשם spit_out_stuff.py (אתה חופשי לתת את השמות הטובים האלה ממני):

from textgenrnn import textgenrnn
t = textgenrnn(‘textgenrnn_weights.hdf5')
t.generate(20, temperature=0.5)

זה החלק המהנה! התסריט למעלה ייתן לך 20 דברים חדשים שכיף להסתכל עליהם. החלקים החשובים בשורה האחרונה הם:

מספר הדברים שיש ליצור: כאן, 20.
הטמפרטורה, שהיא כמו חוגת יצירתיות. ב-0.1, תקבל פלט בסיסי מאוד שכנראה אפילו יותר משעמם ממה שהזנת. ב-1.0, הפלט יהיה כל כך יצירתי שלעתים קרובות מה שיוצא הוא אפילו לא מילים אמיתיות. אתה יכול להגיע גבוה מ-1.0, אם תעז.

כשהרצת את סקריפט האימון, שמת לב שהוא מציג לך פלט לדוגמה בטמפרטורות שונות, כך שאתה יכול להשתמש בזה כדי להנחות כמה תקופות אתה רץ, ובאיזו טמפרטורה תרצה להשתמש כדי ליצור את הפלט הסופי שלך.

לא כל רעיון שהרשת העצבית שלך מעלה יהיה זהב קומדיה. אתה תצטרך לבחור את הטובים ביותר בעצמך. הנה כמה מהכותרות הטובות יותר של Lifehacker שה-AI שלי העלה:

הדרך הטובה ביותר ליצור מחשב נייד לתינוק

איך לשרוד משחק שתייה Backspace

הדרך הטובה ביותר לקנות ראיון עבודה

איך להשיג את המדורה הטובה ביותר בחייך עם הגרפיקה השימושית הזו

כיצד ליצור סרגל פודקאסט משלך

איך להשיג אייפון X חדש אם אתה ארדואינו

איך לנקות את המידות שלך במוזיאון

איך להתחיל עם הסיפורים והחרדות שלך

הדרך הטובה ביותר לייצר דיו משלך מהחורף

איך לשמור על מערכת היחסים שלך עם קונספט דמיוני

הדרך הטובה ביותר להכין כוס יין מושלמת עם Raspberry Pi

הדרך הטובה ביותר לאכול תות אסלה

איך להשיג עבודה טובה יותר בחופשה שלך

הדרך הטובה ביותר לאכול צנצנת עקשנית

השגתי את אלה על ידי משחק עם הטמפרטורה ומספר תקופות האימון, ובכל פעם שראיתי משהו שאהבתי העתקתי אותו לקובץ טקסט של המועדפים שלי. התנסיתי גם בגרסה מילה במילה של האלגוריתם; הסקריפטים שלמעלה משתמשים במודל ברירת המחדל של תו אחר תו. רשימת הכותרות הסופית שלי כוללת תוצאות משניהם.

אם אתה סקרן לגבי חלק מהדחיות, הנה מה שאני מקבל עם טמפרטורה של 0.1:

הדרך הטובה ביותר להישאר בסטרימינג כדי לעצור אלטרנטיבה נוספת להפוך את הטלפון שלך

הדרך הטובה ביותר להזרים את הכוח הטוב ביותר כשאתה לא צריך לדעת על העולם

הדרך הטובה ביותר להישאר התחלת להישאר התחילה לדרכים הנפוצות שלך לעצור מישהו

כיצד לקבל את הדרך הטובה ביותר לראות את הפוסטים הפופולריים הטובים ביותר

הדרך הטובה ביותר להישאר התחילה ליצור את הטלפון שלך

ואם אני מעלה את זה ל-1.5 (יצירתי בצורה מסוכנת):

שרידי היום: כיצד להדביק את האצבע הלא-שנויה

חדש את Qakeuage להיסטוריית הנסיעות, Ovenchime, או "Contreting Passfled

The Risk-Idelecady's Two Copyns, התמקדות Zoomitas

Ifo Went Vape Texts Battery Oro crediblacy Supremee Buldsweoapotties

גריל עשה זאת בעצמך יכול כעת להפיץ את המילים שלך

ברור שנדרשת עזרה אנושית.

הפוך לחבר של הבינה המלאכותית שלך

למרות שרשתות עצביות יכולות ללמוד ממערכות נתונים, הן לא באמת מבינות מה קורה. זו הסיבה שחלק מהתוצאות הטובות ביותר מגיעות משותפויות בין אנשים ומכונות. "אני יודעת שזה כלי שאני משתמשת בו", אומרת ג'אנל שיין, "אבל קשה שלא לחשוב על זה כ-'בואי לרשת עצבית קטנה, אתה יכול לעשות את זה' ו'אוי, זה היה חכם' או' אתה מתבלבל, מסכן קטן.'

כדי להפיק את המרב ממערכת היחסים שלך, תצטרך להדריך את החבר שלך לבינה מלאכותית. לפעמים זה יכול להיות כל כך טוב בניחוש הכללים של מערך הנתונים שלך שהוא פשוט משחזר את אותם דברים שהזנת אותו - גרסת ה-AI של גניבת דעת. תצטרך לבדוק שהפלט המצחיק שלו הוא באמת מקורי.

אולפני בוטניקמשלב אנשים עם מכונות על ידי אימון מקלדות טקסט חזוי. תאר לעצמך שהרמת את הטלפון של חברך והקלדת הודעות רק באמצעות הטקסט החזוי במקלדת שלו. בסופו של דבר תכתוב הודעה משלך, אבל בסגנון שנקרא כמו של חבר שלך. באותו אופן, אתה יכוללאמן מקלדת בוטניקעם כל מקור נתונים שתרצה, ולאחר מכן כתוב עם המילים שסופקו על ידי המקלדת. זה המקום שבודו-קרב עמודי העצות המדהים הזההגיעו מ: שתי קלידים בוטניקים מאומנים על Savage Love ו-Dear Abby.

אם אתה מעדיף לעבוד נגד, ולא עם, החבר האלגוריתמי שלך, בדוק איך ג'אנל שיין התעללה ברשת עצבית שבהתחלה נראתה טובה בזיהוי כבשים רועות באחו. היא צילמה את הכבשים בפוטושופ, והבינה שה-AI רק מחפש כתמים לבנים בדשא. אם היא צבעה את הכבשה בכתום, ה-AI חשב שהם פרחים. אז היאשאלו עוקביה בטוויטרלכבשים במקומות יוצאי דופן ונמצאשה-AI חושב שכבשה במכונית חייבת להיות כלב, עיזים בעץ חייבות להיות ציפורים, וכבשה במטבח חייבת להיות חתול.

הציוץ הזה אינו זמין כרגע. ייתכן שהוא נטען או הוסר.

ל-AI רציני יכולות להיות בעיות דומות, ומשחק עם אלגוריתמים בשביל הכיף יכול לעזור לנו להבין למה הם כל כך מועדים לשגיאות. לדוגמה, בינה מלאכותית אחת שמזהה סרטן עור, למדה בטעות את הכללים השגויים להבדיל בין נגעי עור סרטניים לשפירים. כאשר רופא מוצא נגע גדול, הוא לעתים קרובות מצלם אותו ליד סרגל כדי להראות את הגודל. ה-AIלימד את עצמו בטעותשקל לזהות גידולים סרטניים: רק חפשו סרגלים.

לקח נוסף שאנו יכולים ללמוד הוא שהפלט של אלגוריתם טוב רק כמו הנתונים שאתה מזין בהם. ProPublica מצא כיאלגוריתם אחד שנעשה בו שימוש בגזר הדין היה חמור יותר כלפי נאשמים שחורים מאשר לבנים. היא לא התייחסה לגזע כגורם, אבל הקלט שלה הוביל אותה להאמין, באופן שגוי, שהפשעים והרקע המשותפים לנאשמים שחורים היו מנבאים חזקים יותר לעבירות חוזרות מאשר הפשעים והרקע הקשורים לנאשמים לבנים. למחשב הזה לא היה מושג על המושג גזע, אבל אם נתוני הקלט שלך משקפים הטיה, המחשב יכול בסופו של דבר להנציח את ההטיה הזו. עדיף שנבין את המגבלה הזו של האלגוריתמים, ולא נניח שבגלל שהם לא אנושיים הם חייבים להיות חסרי פניות. (בהצלחה עם AI דיבור השטנה שלך, פייסבוק!)

ערבב את מערכי הנתונים שלך

אין צורך לעצור במערך נתונים אחד; אתה יכול לערבב שניים מהם ולראות מה התוצאות. (אֲנִישילב את רשימות המוצריםמחנויות Goop ו-Infowars, למשל. מעט NSFW.)

אתה יכול גם לאמן אלגוריתם סיווג. שיין אומרת שכבר הייתה לה רשימה של להקות מטאל ורשימה של שמות My Little Pony, אז היאהכשיר מסווג להבחין בהבדל. (Pinky Doom: 99 אחוז מתכת.) ברגע שיש לך הכשרה של מסווג, אתה יכול להזין בו כל דבר ולקבל קריאה. בנדיקט קמברבאץ': 96 אחוז מתכת.

הציוץ הזה אינו זמין כרגע. ייתכן שהוא נטען או הוסר.

אתה יכול גם להזין כל דבר שאתה אוהב לרשת textgenrnn מאומנת. כאשר אתה מציין כמה פריטים אתה רוצה ובאיזו טמפרטורה (יצירתיות) הרשת צריכה להשתמש, אתה יכול גם לתת לה קידומת. לאחר מכן הוא ינסה להמציא מילים שצריכות לעקוב אחרי הקידומת הזו. לאחר שאימנתי את כותרות Lifehacker, ביקשתי מה-AI לתת לי כותרות שמתחילות ב-"3 Ingredient Happy Hour". זה הגיב בכמה קוקטיילים בדיוניים נפלאים (שוב, אלה הבחירות שלי מתוך רשימה ארוכה יותר):

3 מרכיבים Happy Hour: שדרוג העשבים המלחיץ

3 מרכיבים Happy Hour: A Cake's Strawbreak

3 מרכיבים Happy Hour: The Darkled Pot

3 מרכיבים Happy Hour: הפיצה והמשקה כי הם כנפי סוחר

3 מרכיבים Happy Hour: The Ferrent Pot

3 מרכיבים Happy Hour: הגרון לתוך מרענן

3 מרכיבים Happy Hour: הזמנת הבר הטובה ביותר

3 מרכיבים Happy Hour: The Leftover Party Controci

3 מרכיבים Happy Hour: חיתוך רום קיץ

3 מרכיבים Happy Hour: הקוקונטי הטוב ביותר

3 מרכיבים Happy Hour: The Beautiful Shicline

3 מרכיבים Happy Hour: הממתק החצוף

אל תתפלאו אם תראו את אלה בפוסט Lifehacker עתידי; קלייר לואר, עורכת המזון והמשקאות שלנו, אומרת שהיא רוצה לנסות להכין כמה כאלה.

אבל במקום לחכות למתכוני המומחים שלה, החלטתי להאכילאֵלֶהגם לרשת עצבית. אספתי כמה מתכוני קוקטיילים ממדריך הקוקטיילים של כריס לודרואתמילון מונחים של קוקטיילים של WikiBooks, וסידרה אותם כך שכל קוקטייל תפס שורה אחת של קובץ טקסט, כאשר כותרת הקוקטייל היא המילים הראשונות. זה אומר שאוכל לבחור שם קוקטייל ולבקש מהרשת העצבית שלי שעברה הכשרה בקוקטיילים לספק את המתכון הבא. הנה כמה מהתוצאות:

The Best Coconati - עוז. בנדיקטין ה. 1 מקף ארומטי ב.

ממתק החצוף i. 1 אונקיה. בלנדי שרי ב. 1.5 אונקיות אננס טרי ד. לונסטין ברנדי בול דה שם בגדול ג'מייקית ג. 2 מקפים אננס ד. 1 מקף ארומטי ביטר ה. מקף Aromatic Gin ii. 1 אונקיה. וודקה II. .5 אונקיות. רום מיושן ג. 2 מקפים של Angostura Bitters i. מערבבים / מסננים / זכוכית ניק אנד נורה / קרח / 1

The Ferrent Pot - - 1.25 אונקיות. Green Chartreuse 1.5 אונקיות. London Dry Gin ב. .75 אונקיות. מילוי וויסקי ב. חצי וויסקי כתום

אתה יכול לבקש הכל, כמובן:

The Beth Skwarecki - 1 אונקייה. מים סקוטש מעורב (מיץ) ב. 1 אונקיה. חלבון ביצה בזכוכית סלעים גדולה עם זהות 1934 או מייצר Babbino

The Lifehacker ג. 14 וודקה מרטיני i. .75 אונקיות. קמפרי אי. שייק / זן עדין / קופה / טוויסט לימון

נתוני הקלט היו רק כמה מאות מתכוני קוקטיילים, אז נאלצתי לשנות את הטמפרטורהדֶרֶךכדי להשיג משהו מעניין. ובטמפרטורה גבוהה (1.0, במקרה הזה), לפעמים מקבלים מילים שהן לא באמת מילים. בהצלחה במציאת כל לונסטין ברנדי או בלנדי שרי בחנות - אבל אם תעשה זאת, AI חיית המחמד שלי ישמח מאוד.

בת' סקוורצקי

עורך בריאות בכיר

Beth Skwarecki היא עורכת הבריאות הבכירה של Lifehacker. בעלת תואר ראשון בביולוגיה, כתבה שני ספרים ומאמנת אישית מוסמכת. היא כותבת על בריאות, כושר ומדע כבר למעלה מעשור, ויכולה לסחוט 225 קילו.

קרא את הביוגרפיה המלאה של בת'

איך לאמן את הרשת העצבית הראשונה שלך

הפוך לחבר של הבינה המלאכותית שלך

ערבב את מערכי הנתונים שלך

Related Posts

למד את הצלילים של כונן קשיח כושל כדי למנוע אובדן נתונים

סנן רישום משרות לפי שכר ב

עכשיו אתה יכול לשלוט ב

במה אנו משתמשים: עצות הציוד והפרודוקטיביות האהובות על אדם פאש

הצג רשימה של ספריות משנה בלבד

Yugma משלבת שיתוף מסך עם סקייפ