ABOUT THE SPEAKER
Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com
TEDWomen 2013

Rupal Patel: Synthetic voices, as unique as fingerprints

รูเพล พาเทล (Rupal Patel): เสียงสังเคราะห์ มีเอกลักษณ์ดุจลายนิ้วมือ

Filmed:
944,754 views

หลายคนที่มีความผิดปกติเกี่ยวกับการออกเสียงใช้อุปกรณ์ที่ควบคุมด้วยคอมพิวเตอร์ในการสื่อสาร แต่กระนั้นพวกเขาก็มีตัวเลือกเสียงไม่มาก นั่นเป็นเหตุว่าทำไม สตีเฟน ฮอว์คิง ถึงได้มีสำเนียงอเมริกัน และทำไมผู้คนมากมายถึงมีเสียงเหมือนกัน และก็บ่อยครั้งที่มันไม่สอดคล้องกับตัวตนผู้ใช้ นักวิทยาศาสตร์ด้านการพูด รูเพล พาเทล ต้องการที่จะทำอะไรบางอย่างเกี่ยวกับสิ่งนี้ และในการบรรยายที่น่าประทับใจนี้ เธอได้แบ่งปันงานของเธอ ที่ได้ทำการสร้างเสียงที่มีเอกลักษณ์สำหรับผู้ที่ไร้เสียง
- Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that. Full bio

Double-click the English transcript below to play the video.

00:12
I'd like to talk todayในวันนี้
0
719
1490
วันนี้ฉันอยากจะพูด
00:14
about a powerfulมีอำนาจ and fundamentalพื้นฐาน aspectแง่มุม
1
2209
2927
เกี่ยวกับมุมมองที่ทรงพลังและสำคัญ
00:17
of who we are: our voiceเสียงพูด.
2
5136
3598
ของตัวตนของเรา: เสียงพูดของเรา
00:20
Eachแต่ละ one of us has a uniqueเป็นเอกลักษณ์ voiceprintvoiceprint
3
8734
2746
พวกเราแต่ละคนมีรูปแบบเสียงที่เป็นเอกลักษณ์
00:23
that reflectsสะท้อนให้เห็นถึง our ageอายุ, our sizeขนาด,
4
11480
2289
ซึ่งสะท้อนอายุ ขนาด
00:25
even our lifestyleวิถีการดำเนินชีวิต and personalityบุคลิกภาพ.
5
13769
3237
หรือแม้กระทั่งวิถีชีวิตและบุคลิกภาพของเรา
00:29
In the wordsคำ of the poetกวี LongfellowLongfellow,
6
17006
2142
นักกวีนาม ลองเฟลโลว์ กล่าวไว้ว่า
00:31
"the humanเป็นมนุษย์ voiceเสียงพูด is the organอวัยวะ of the soulจิตวิญญาณ."
7
19148
3870
"เสียงของมนุษย์คือเครื่องดนตรีของจิตวิญญาณ"
00:35
As a speechการพูด scientistนักวิทยาศาสตร์, I'm fascinatedหลงใหล
8
23018
2747
ในฐานะนักวิทยาศาสตร์ด้านการพูด ฉันสนใจว่า
00:37
by how the voiceเสียงพูด is producedผลิต,
9
25765
1829
เสียงถูกผลิตออกมาอย่างไร
00:39
and I have an ideaความคิด for how it can be engineeredวิศวกรรม.
10
27594
3658
และฉันมีความคิดว่ามันจะถูกสร้างขึ้นมาได้อย่างไร
00:43
That's what I'd like to shareหุ้น with you.
11
31252
2210
นั่นคือสิ่งที่ฉันอยากจะแบ่งปันกับคุณ
00:45
I'm going to startเริ่มต้น by playingเล่น you a sampleตัวอย่าง
12
33462
1814
ฉันอยากจะเริ่มโดยให้คุณได้ชมตัวอย่าง
00:47
of a voiceเสียงพูด that you mayอาจ recognizeรับรู้.
13
35276
1871
ของเสียงที่คุณอาจจะจำได้
00:49
(Recordingการบันทึก) Stephenสตีเฟ่น Hawkingฮอว์คิง: "I would have thought
14
37147
1304
(เสียงบันทึก) สตีเฟน ฮอว์คิง: "ผมคิดไปว่า
00:50
it was fairlyอย่างเป็นธรรม obviousชัดเจน what I meantความหมาย."
15
38451
2749
มันค่อนข้างจะชัดเจนว่าผมหมายความว่าอย่างไร"
00:53
RupalRupal Patelเทล: That was the voiceเสียงพูด
16
41200
1280
รูแพล พาเทล: นั่นเป็นเสียง
00:54
of Professorศาสตราจารย์ Stephenสตีเฟ่น Hawkingฮอว์คิง.
17
42480
2086
ของศาสตราจารย์สตีเฟน ฮอว์คิง
00:56
What you mayอาจ not know is that sameเหมือนกัน voiceเสียงพูด
18
44566
3849
สิ่งที่คุณอาจไม่รู้ก็คือเสียงเดียวกันนี้
01:00
mayอาจ alsoด้วย be used by this little girlสาว
19
48415
2478
อาจถูกใช้โดยเด็กผู้หญิงตัวเล็กๆ คนนี้
01:02
who is unableไม่สามารถ to speakพูด
20
50893
1697
ผู้ซึ่งไม่สามารถพูดได้
01:04
because of a neurologicalเกี่ยวกับประสาทวิทยา conditionเงื่อนไข.
21
52590
2597
ด้วยความผิดปกติเกี่ยวกับระบบประสาท
01:07
In factความจริง, all of these individualsบุคคล
22
55187
2068
อันที่จริง คนเหล่านี้
01:09
mayอาจ be usingการใช้ the sameเหมือนกัน voiceเสียงพูด,
23
57255
2012
อาจกำลังใช้เสียงเดียวกัน
01:11
and that's because there's
only a fewน้อย optionsตัวเลือก availableใช้ได้.
24
59267
3557
และนั่นก็เป็นเพราะว่า มันมีทางเลือกไม่มากนัก
01:14
In the U.S. aloneคนเดียว, there are 2.5 millionล้าน Americansชาวอเมริกัน
25
62824
4317
ในสหรัฐฯประเทศเดียว มีชาวอเมริกัน 2.5 ล้านคน
01:19
who are unableไม่สามารถ to speakพูด,
26
67141
1610
ที่ไม่สามารถพูดได้
01:20
and manyจำนวนมาก of whomใคร use computerizedคอมพิวเตอร์ devicesอุปกรณ์
27
68751
2622
และมีหลายคนที่ใช้อุปกรณ์ที่ควบคุมโดยคอมพิวเตอร์
01:23
to communicateสื่อสาร.
28
71373
1522
ในการสื่อสาร
01:24
Now that's millionsล้าน of people worldwideทั่วโลก
29
72895
3479
ทีนี้ คนหลายล้านทั่วโลก
01:28
who are usingการใช้ genericทั่วไป voicesเสียง,
30
76374
1652
ผู้ที่กำลังใช้เสียงพื้นฐาน
01:30
includingรวมไปถึง Professorศาสตราจารย์ Hawkingฮอว์คิง,
31
78026
1446
ซึ่งรวมไปถึงศาสตราจารย์ฮอว์คิง
01:31
who usesการใช้งาน an American-accentedสำเนียงอเมริกัน voiceเสียงพูด.
32
79472
4833
ผู้ที่ใช้เสียงที่มีสำเนียงอเมริกัน
01:36
This lackไม่มี of individuationindividuation of the syntheticสังเคราะห์ voiceเสียงพูด
33
84305
3328
ความไร้ตัวตนของเสียงสังเคราะห์นี้
01:39
really hitตี home
34
87633
1416
ชัดเจนสำหรับฉัน
01:41
when I was at an assistiveอำนวยความสะดวก technologyเทคโนโลยี conferenceการประชุม
35
89049
2472
เมื่อฉันร่วมงานสัมมนาเกี่ยวกับเทคโนโลยีอุปกรณ์ช่วย
01:43
a fewน้อย yearsปี agoมาแล้ว,
36
91521
1850
เมื่อไม่กี่ปีก่อน
01:45
and I recallจำ walkingที่เดิน into an exhibitจัดแสดง hallห้องโถง
37
93371
3604
และฉันจำได้ถึงตอนที่เดินเข้าไปในโถงนิทรรศการ
01:48
and seeingเห็น a little girlสาว and a grownเจริญเติบโต man
38
96975
3044
และเห็นเด็กผู้หญิงตัวเล็กๆ และผู้ใหญ่เพศชาย
01:52
havingมี a conversationการสนทนา usingการใช้ theirของพวกเขา devicesอุปกรณ์,
39
100019
2916
กำลังคุยกันโดยใช้เครื่องของพวกเขา
01:54
differentต่าง devicesอุปกรณ์, but the sameเหมือนกัน voiceเสียงพูด.
40
102935
4284
คนละเครื่องแต่มีเสียงเดียวกัน
01:59
And I lookedมอง around and I saw this happeningสิ่งที่เกิดขึ้น
41
107219
1909
และฉันก็มองไปรอบๆ และเห็นสิ่งนี้เกิดขึ้น
02:01
all around me, literallyอย่างแท้จริง hundredsหลายร้อย of individualsบุคคล
42
109128
4190
รอบๆ ตัวฉัน ผู้คนมากนับร้อย
02:05
usingการใช้ a handfulกำมือ of voicesเสียง,
43
113318
2738
ใช้เสียงพูดเพียงหยิบมือเดียว
02:08
voicesเสียง that didn't fitพอดี theirของพวกเขา bodiesร่างกาย
44
116056
3091
เสียงที่ไม่ได้เหมาะกับร่างกายของเขา
02:11
or theirของพวกเขา personalitiesบุคลิก.
45
119147
2082
หรือบุคลิกภาพของพวกเขา
02:13
We wouldn'tจะไม่ dreamฝัน of fittingเหมาะสม a little girlสาว
46
121229
2727
เราคงไม่คาดไม่ฝันว่าที่จะให้เด็กผู้หญิงตัวเล็กๆ
02:15
with the prostheticเทียม limbกิ่ง of a grownเจริญเติบโต man.
47
123956
3396
มีแขนขาเทียมของผู้ใหญ่เพศชาย
02:19
So why then the sameเหมือนกัน prostheticเทียม voiceเสียงพูด?
48
127352
3304
แล้วทำไมถึงทำแบบนั้นกับเสียงเทียม
02:22
It really struckหลง me,
49
130656
1291
มันกระตุ้นฉันอย่างจัง
02:23
and I wanted to do something about this.
50
131947
3151
และฉันต้องการที่จะทำอะไรบางอย่างกับมัน
02:27
I'm going to playเล่น you now a sampleตัวอย่าง
51
135098
1953
ฉันกำลังจะเล่นตัวอย่างให้คุณชม
02:29
of someoneบางคน who has, two people actuallyแท้จริง,
52
137051
3288
เกี่ยวกับบุคคลสองคน
02:32
who have severeรุนแรง speechการพูด disordersความผิดปกติ.
53
140339
1768
ที่มีการพูดผิดปกติขั้นรุนแรง
02:34
I want you to take a listen to how they soundเสียง.
54
142107
3230
ฉันอยากให้คุณฟังว่าเสียงพวกเขาเป็นอย่างไร
02:37
They're sayingคำพูด the sameเหมือนกัน utteranceคำพูด.
55
145337
2357
พวกเขากำลังเปล่งคำเสียงเดียวกัน
02:39
(First voiceเสียงพูด)
56
147694
2432
(เสียงแรก)
02:42
(Secondที่สอง voiceเสียงพูด)
57
150126
3617
(เสียงที่สอง)
02:45
You probablyอาจ didn't understandเข้าใจ what they said,
58
153743
2412
คุณอาจไม่เข้าใจหรอกว่าพวกเขาพูดอะไร
02:48
but I hopeหวัง that you heardได้ยิน
59
156155
1854
แต่ฉันหวังว่าคุณจะได้ยิน
02:50
theirของพวกเขา uniqueเป็นเอกลักษณ์ vocalเกี่ยวกับเสียงพูด identitiesอัตลักษณ์.
60
158009
4283
เสียงที่เป็นเอกลักษณ์ประจำตัวของพวกเขา
02:54
So what I wanted to do nextต่อไป is,
61
162292
2813
ดังนั้น สิ่งที่ฉันต้องการทำต่อไปก็คือ
02:57
I wanted to find out how we could harnessเทียม
62
165105
2384
ฉันต้องการค้นหาว่าเราจะใช้ประโยชน์
02:59
these residualเหลือ vocalเกี่ยวกับเสียงพูด abilitiesความสามารถ
63
167489
1821
ศักยภาพของเสียงที่เหลืออยู่เหล่านี้ได้อย่างไร
03:01
and buildสร้าง a technologyเทคโนโลยี
64
169310
2016
และสร้างเทคโนโลยี
03:03
that could be customizedที่กำหนดเอง for them,
65
171326
2143
ที่สามารถสนองความต้องการของพวกเขา
03:05
voicesเสียง that could be customizedที่กำหนดเอง for them.
66
173469
2429
เสียงที่สามารถปรับแต่งให้เข้ากับพวกเขา
03:07
So I reachedถึง out to my collaboratorผู้ประสานงาน, Timทิม BunnellBunnell.
67
175898
2685
ฉันจึงขอความช่วยเหลือจากผู้ร่วมโครงการ
ทิม บันเนล
03:10
Drดร. BunnellBunnell is an expertผู้เชี่ยวชาญ in speechการพูด synthesisสังเคราะห์,
68
178583
3063
ดร. บันเนล เป็นผู้เชี่ยวชาญเรื่องเสียงสังเคราะห์
03:13
and what he'dเขาต้องการ been doing is buildingอาคาร
69
181646
2033
และเขากำลังสร้าง
03:15
personalizedส่วนบุคคล voicesเสียง for people
70
183679
1881
เสียงที่สร้างสำหรับแต่ละคน
03:17
by puttingวาง togetherด้วยกัน
71
185560
2097
โดยผสาน
03:19
pre-recordedที่บันทึกไว้ล่วงหน้า samplesตัวอย่าง of theirของพวกเขา voiceเสียงพูด
72
187657
2150
ตัวอย่างเสียงของพวกเขาที่บันทึกเอาไว้
03:21
and reconstructingการฟื้นฟู a voiceเสียงพูด for them.
73
189807
2879
และเสียงของพวกเขาที่สร้างขึ้นใหม่
03:24
These are people who had lostสูญหาย theirของพวกเขา voiceเสียงพูด
74
192686
1712
นี่คือผู้คนที่สูญเสียเสียงของพวกเขาไป
03:26
laterต่อมา in life.
75
194398
1911
ในภายหลัง
03:28
We didn't have the luxuryหรูหรา
76
196309
1394
เราไม่ได้มีตัวอย่างเสียงที่บันทึกการพูด
03:29
of pre-recordedที่บันทึกไว้ล่วงหน้า samplesตัวอย่าง of speechการพูด
77
197703
1774
เอาไว้อย่างมากมาย
03:31
for those bornโดยกำเนิด with speechการพูด disorderความไม่เป็นระเบียบ.
78
199477
2292
สำหรับผู้ที่มีความผิดปกติทางการพูดมาแต่กำเนิด
03:33
But I thought, there had to be a way
79
201769
2537
แต่ฉันคิดว่า มันจะต้องมีหนทาง
03:36
to reverseถอยหลัง engineerวิศวกร a voiceเสียงพูด
80
204306
1944
ที่จะเปลี่ยนเสียงที่ทำขึ้น
03:38
from whateverอะไรก็ตาม little is left over.
81
206250
2291
ย้อนกลับไปหาสิ่งที่ยังเหลืออยู่เล็กน้อย
03:40
So we decidedตัดสินใจ to do exactlyอย่างแน่นอน that.
82
208541
2714
ดังนั้น เราตัดสินใจที่จะทำอย่างนั้น
03:43
We setชุด out with a little bitบิต of fundingการระดมทุน
from the Nationalแห่งชาติ Scienceวิทยาศาสตร์ Foundationมูลนิธิ,
83
211255
3403
เราเริ่มด้วยเงินทุนเพียงเล็กน้อย
จากองค์กรวิทยาศาสตร์แห่งชาติ
03:46
to createสร้าง custom-craftedที่กำหนดเองที่สร้างขึ้นมา voicesเสียง that capturedถูกจับกุม
84
214658
3565
เพื่อจะสร้างเสียงที่ทำขึ้นตามสั่ง
03:50
theirของพวกเขา uniqueเป็นเอกลักษณ์ vocalเกี่ยวกับเสียงพูด identitiesอัตลักษณ์.
85
218223
1536
ที่มีเอาเสียงที่เป็นเอกลักษณ์ของพวกเขาไว้
03:51
We call this projectโครงการ VocaliDVocaliD, or vocalเกี่ยวกับเสียงพูด I.D.,
86
219759
3203
เราเรียกโครงการนี้ว่า VocaliD หรือ vocal I.D
03:54
for vocalเกี่ยวกับเสียงพูด identityเอกลักษณ์.
87
222962
2033
ที่ย่อมาจาก เอกลักษณ์เสียง (vocal identity)
03:56
Now before I get into the detailsรายละเอียด of how
88
224995
2674
ทีนี้ ก่อนที่จะฉันพูดถึงรายละเอียดที่ว่า
03:59
the voiceเสียงพูด is madeทำ and let you listen to it,
89
227669
2048
เสียงทำได้อย่างไร และให้คุณได้รับฟัง
04:01
I need to give you a realจริง quickรวดเร็ว
speechการพูด scienceวิทยาศาสตร์ lessonบทเรียน. Okay?
90
229717
3350
ฉันต้องสอนเรื่องวิทยาศาสตร์การพูดแบบคร่าวๆ ก่อนนะคะ
04:05
So first, we know that the voiceเสียงพูด is changingเปลี่ยนแปลง
91
233067
3159
ก่อนอื่น เรารู้ว่าเสียงนั้นเปลี่ยนไปอย่างมาก
04:08
dramaticallyเป็นคุ้งเป็นแคว over the courseหลักสูตร of developmentพัฒนาการ.
92
236226
2854
ระหว่างที่เราเจริญเติบโต
04:11
Childrenเด็ก ๆ soundเสียง differentต่าง from teensวัยรุ่น
93
239080
2090
เสียงเด็กต่างจากวัยรุ่น
04:13
who soundเสียง differentต่าง from adultsผู้ใหญ่.
94
241170
1463
ซึ่งก็มีเสียงต่างจากผู้ใหญ่
04:14
We'veเราได้ all experiencedมีประสบการณ์ this.
95
242633
2642
พวกเราเคยมีประสบการณ์เหล่านี้
04:17
Factความจริง numberจำนวน two is that speechการพูด
96
245275
3363
ข้อเท็จจริงที่สองก็คือ
04:20
is a combinationการรวมกัน of the sourceแหล่ง,
97
248638
2553
เสียงนั้นประกอบขึ้นจากแหล่ง
04:23
whichที่ is the vibrationsการสั่นสะเทือน generatedสร้าง by your voiceเสียงพูด boxกล่อง,
98
251191
3479
ซึ่งก็คือการสั่นสะเทือนที่เกิดจากกล่องเสียงของคุณ
04:26
whichที่ are then pushedผลักดัน throughตลอด
99
254670
1939
ซึ่งมันจะถูกดันขึ้น
04:28
the restส่วนที่เหลือ of the vocalเกี่ยวกับเสียงพูด tractเนื้อที่.
100
256609
2437
ผ่านหลอดเสียง
04:31
These are the chambersห้องผู้พิพากษา of your headหัว and neckคอ
101
259046
2484
นี่คือช่องโพรงต่างๆ ในศีรษะและคอของคุณ
04:33
that vibrateสั่น,
102
261530
1239
ที่สั่นสะเทือน
04:34
and they actuallyแท้จริง filterกรอง that sourceแหล่ง soundเสียง
103
262769
2110
และที่จริงแล้วพวกมันก็เป็นตัวกรองเสียงจากแหล่ง
04:36
to produceก่อ consonantsพยัญชนะ and vowelsสระ.
104
264879
2537
เพื่อจะสร้างพยัญชนะและสระ
04:39
So the combinationการรวมกัน of sourceแหล่ง and filterกรอง
105
267416
3860
ดังนั้นส่วนผสมจากแหล่งและตัวกรอง
04:43
is how we produceก่อ speechการพูด.
106
271276
2630
ก็เป็นตัวก่อให้เกิดเสียงของเรา
04:45
And that happensที่เกิดขึ้น in one individualรายบุคคล.
107
273906
3026
และนั่นเกิดขึ้นในตัวบุคคล
04:48
Now I told you earlierก่อน that I'd spentการใช้จ่าย
108
276932
2626
ฉันบอกคุณไว้ก่อนหน้านี้ว่า
04:51
a good partส่วนหนึ่ง of my careerอาชีพ
109
279558
2025
ฉันได้ใช้เวลาส่วนใหญ่ในชีวิตการทำงาน
04:53
understandingความเข้าใจ and studyingการศึกษา
110
281583
2453
เพื่อที่จะเข้าใจและศึกษา
04:56
the sourceแหล่ง characteristicsลักษณะ of people
111
284036
1958
ลักษณะของแหล่งของบุคคล
04:57
with severeรุนแรง speechการพูด disorderความไม่เป็นระเบียบ,
112
285994
2301
ที่มีความผิดปกติด้านการพูด
05:00
and what I've foundพบ
113
288295
1465
และสิ่งที่ฉันได้พบ
05:01
is that even thoughแม้ theirของพวกเขา filtersฟิลเตอร์ were impairedวิกล,
114
289760
3366
ก็คือแม้ว่าตัวกรองของพวกเขาจะผิดปกติ
05:05
they were ableสามารถ to modulateปรับ theirของพวกเขา sourceแหล่ง:
115
293126
2961
พวกเขาสามารถที่จะเปลี่ยนระดับเสียงของแหล่งได้
05:08
the pitchขว้าง, the loudnessเสียงดัง, the tempoจังหวะ of theirของพวกเขา voiceเสียงพูด.
116
296087
3262
เสียงสูงต่ำ ความดัง และจังหวะของเสียง
05:11
These are calledเรียกว่า prosodyฉันทลักษณ์, and
I've been documentingจัดเก็บเอกสาร for yearsปี
117
299349
3368
เหล่านี้เรียกว่า ฉันทลักษณ์ [เสียงและจังหวะ]
และฉันได้ทำการรวบรวมมาหลายปี
05:14
that the prosodicเกี่ยวกับฉันทลักษณ์ abilitiesความสามารถ of these individualsบุคคล
118
302717
2277
ว่าความสามารถในเชิงฉันทลักษณ์ของคนเหล่านี้
05:16
are preservedดอง.
119
304994
1575
ถูกรักษาเอาไว้
05:18
So when I realizedตระหนัก that those sameเหมือนกัน cuesชี้นำ
120
306569
4087
ดังนั้น เมื่อฉันตระหนักว่าเบาะแสเดียวกันนั้น
05:22
are alsoด้วย importantสำคัญ for speakerผู้พูด identityเอกลักษณ์,
121
310656
2769
สำคัญต่อเอกลักษณ์ของผู้พูดเช่นกัน
05:25
I had this ideaความคิด.
122
313425
2015
ฉันก็เกิดความคิดนี้
05:27
Why don't we take the sourceแหล่ง
123
315440
2516
ทำไมเราไม่นำแหล่ง
05:29
from the personคน we want the voiceเสียงพูด to soundเสียง like,
124
317956
2213
จากคนที่เราต้องการให้เสียงเป็นแบบเขา
05:32
because it's preservedดอง,
125
320169
1463
เพราะว่ามันถูกรักษาเอาไว้
05:33
and borrowยืม the filterกรอง
126
321632
2135
และยืมตัวกรอง
05:35
from someoneบางคน about the sameเหมือนกัน ageอายุ and sizeขนาด,
127
323767
3229
จากใครสักคนที่มีอายุและขนาดเท่าๆ กัน
05:39
because they can articulateเป็นปล้อง speechการพูด,
128
327011
2407
เพราะพวกเขาพูดได้อย่างชัดเจน
05:41
and then mixผสม them?
129
329418
1791
และผสมมันเข้าด้วยกัน
05:43
Because when we mixผสม them,
130
331209
1787
เพราะเมื่อเราผสมมันแล้ว
05:44
we can get a voiceเสียงพูด that's as clearชัดเจน
131
332996
1698
เราจะได้เสียงที่ชัดเจน
05:46
as our surrogateตัวแทน talkerนักพูด --
132
334694
1754
พอกับเสียงจากผู้พูดที่เป็นตัวแทนของเรา
05:48
that's the personคน we borrowedยืม the filterกรอง from—
133
336448
2595
ซึ่งเรายืมตัวกรองมาจากเขา
05:51
and is similarคล้ายคลึงกัน in identityเอกลักษณ์ to our targetเป้า talkerนักพูด.
134
339043
4649
และมีความเป็นเอกลักษณ์ที่ใกล้เคียง
กับผู้พูดที่เป็นเป้าหมายของเรา
05:55
It's that simpleง่าย.
135
343692
1427
ง่ายๆ แบบนั้นล่ะค่ะ
05:57
That's the scienceวิทยาศาสตร์ behindหลัง what we're doing.
136
345119
2934
นั่นคือความรู้เบื้องหลังที่เราใช้
06:00
So onceครั้งหนึ่ง you have that in mindใจ,
137
348053
3533
ดังนั้น เมื่อคุณมีสิ่งนั้นอยู่ในใจแล้ว
06:03
how do you go about buildingอาคาร this voiceเสียงพูด?
138
351586
2258
คุณจะสร้างเสียงขึ้นมาได้อย่างไร
06:05
Well, you have to find someoneบางคน
139
353844
1480
เอาล่ะ คุณต้องหาใครสักคน
06:07
who is willingเต็มใจ to be a surrogateตัวแทน.
140
355324
2400
ผู้ที่เต็มใจจะเป็นตัวแทน
06:09
It's not suchอย่างเช่น an ominousเป็นลางไม่ดี thing.
141
357724
2264
มันไม่ได้เป็นเรื่องเลวร้ายอะไร
06:11
Beingกำลัง a surrogateตัวแทน donorผู้บริจาค
142
359988
1523
การเป็นตัวแทนนั้น
06:13
only requiresต้องมี you to say a fewน้อย hundredร้อย
143
361511
2788
คุณก็แค่ต้องเปล่งเสียงสักร้อย
06:16
to a fewน้อย thousandพัน utterancesคำพูด.
144
364299
2242
ถึงพันเสียง
06:18
The processกระบวนการ goesไป something like this.
145
366541
2003
ขึ้นตอนเป็นไปประมาณนี้
06:20
(Videoวีดีโอ) Voiceเสียงพูด: Things happenเกิดขึ้น in pairsคู่.
146
368544
2190
(วีดีโอ) เสียง: สิ่งนั้นเกิดขึ้นเป็นคู่
06:22
I love to sleepนอน.
147
370734
1925
ฉันชอบนอน
06:24
The skyท้องฟ้า is blueสีน้ำเงิน withoutไม่มี cloudsเมฆ.
148
372659
3882
ท้องฟ้าสีครามไร้ซึ่งเมฆ
06:28
RPRP: Now she's going to go on like this
149
376541
2002
รูแพล: เอาล่ะ เธอจะพูดแบบนั้นไปเรื่อยๆ
06:30
for about threeสาม to fourสี่ hoursชั่วโมง,
150
378543
1919
สักสามถึงสี่ชั่วโมง
06:32
and the ideaความคิด is not for her to say everything
151
380462
3005
และไม่ใช่ว่าจะให้เธอพูดทุกๆ อย่าง
06:35
that the targetเป้า is going to want to say,
152
383467
2045
ที่เป้าหมายต้องการจะพูด
06:37
but the ideaความคิด is to coverปก all the differentต่าง combinationsอยู่รวมกัน
153
385512
3395
แต่แผนก็คือเพื่อที่จะให้มันครอบคลุมส่วนผสมต่างๆ ทั้งหมด
06:40
of the soundsเสียง that occurเกิดขึ้น in the languageภาษา.
154
388907
3271
ของเสียงที่มีอยู่ในภาษา
06:44
The more speechการพูด you have,
155
392178
1638
ยิ่งมีถ้อยคำมากเท่าไร
06:45
the better soundingการทำให้เกิดเสียง voiceเสียงพูด you're going to have.
156
393816
2305
คุณก็จะยิ่งได้เสียงที่ฟังดูดี
06:48
Onceครั้งหนึ่ง you have those recordingsบันทึก,
157
396121
1673
เมื่อคุณได้ทำการบันทึกเสียงแล้ว
06:49
what we need to do
158
397794
1413
ที่เราต้องทำก็คือ
06:51
is we have to parseวิเคราะห์คำ these recordingsบันทึก
159
399207
2718
เราต้องแจงสิ่งที่บันทึกไว้
06:53
into little snippetsเกร็ดเล็กเกร็ดน้อย of speechการพูด,
160
401925
2449
ให้เป็นส่วนเล็กๆ ของถ้อยคำ
06:56
one-หนึ่ง- or two-soundสองเสียง combinationsอยู่รวมกัน,
161
404374
2337
เสียงผสมหนึ่งหรือสองเสียง
06:58
sometimesบางครั้ง even wholeทั้งหมด wordsคำ
162
406711
1883
หรือบางครั้งทั้งคำ
07:00
that startเริ่มต้น populatingประชากร a datasetชุด or a databaseฐานข้อมูล.
163
408594
4516
ที่เริ่มจะพบบ่อยๆ ในผลลัพท์หรือฐานข้อมูล
07:05
We're going to call this databaseฐานข้อมูล a voiceเสียงพูด bankธนาคาร.
164
413110
3717
เราจะเรียกฐานข้อมูลนี้ว่าคลังของเสียง
07:08
Now the powerอำนาจ of the voiceเสียงพูด bankธนาคาร
165
416827
2096
ความสามารถของคลังเสียงก็คือ
07:10
is that from this voiceเสียงพูด bankธนาคาร,
166
418923
2014
จากคลังเสียงนี้
07:12
we can now say any newใหม่ utteranceคำพูด,
167
420937
2011
เราสามารถเปล่งเสียงใหม่เป็นอะไรก็ได้
07:14
like, "I love chocolateช็อคโกแลต" --
168
422948
1424
เช่น "ฉันชอบช๊อกโกแลต"
07:16
everyoneทุกคน needsจำเป็น to be ableสามารถ to say that—
169
424372
1739
ทุกคนควรที่จะพูดได้จริงไหมคะ
07:18
fishปลา throughตลอด that databaseฐานข้อมูล
170
426111
1831
ค้นหาจากในคลังเสียง
07:19
and find all the segmentsกลุ่ม necessaryจำเป็น
171
427942
1940
และหาส่วนทั้งหมดที่สำคัญ
07:21
to say that utteranceคำพูด.
172
429882
1929
ที่จะเปล่งคำเหล่านั้นออกมา
07:23
(Videoวีดีโอ) Voiceเสียงพูด: I love chocolateช็อคโกแลต.
173
431811
1789
(วีดีโอ) เสียง: ฉันชอบช๊อกโกแลต
07:25
RPRP: So that's speechการพูด synthesisสังเคราะห์.
174
433600
1391
รูแพล: นั่นคือการสังเคราะห์เสียง
07:26
It's calledเรียกว่า concatenativeการเชื่อม synthesisสังเคราะห์,
and that's what we're usingการใช้.
175
434991
2573
มันถูกเรียกว่า การสังเคราะห์แบบเชื่อมต่อกัน
และนั่นก็เป็นสิ่งที่เราใช้
07:29
That's not the novelนวนิยาย partส่วนหนึ่ง.
176
437564
1533
นั่นไม่ใช่สิ่งใหม่อะไร
07:31
What's novelนวนิยาย is how we make it soundเสียง
177
439097
2221
ส่วนที่เป็นสิ่งใหม่ก็คือวิธีที่เราทำให้เสียง
07:33
like this youngหนุ่มสาว womanหญิง.
178
441318
1457
เหมือนกับผู้หญิงวัยเยาว์
07:34
This is Samanthaซาแมนต้า.
179
442775
1524
นี่คือซาแมนทา
07:36
I metพบ her when she was nineเก้า,
180
444299
2346
ฉันพบเธอเมื่อเธอได้เก้าขวบ
07:38
and sinceตั้งแต่ then, my teamทีม and I
181
446645
1897
และจับจากนั้น ฉันและกลุ่มวิจัย
07:40
have been tryingพยายาม to buildสร้าง her a personalizedส่วนบุคคล voiceเสียงพูด.
182
448542
2714
ก็ได้พยายามที่จะสร้างเสียงที่มีตัวตนเป็นเธอ
07:43
We first had to find a surrogateตัวแทน donorผู้บริจาค,
183
451256
3099
ก่อนอื่นเราต้องหาตัวแทนผู้บริจาค
07:46
and then we had to have Samanthaซาแมนต้า
184
454355
1818
และจากนั้นเราต้องให้ซาแมนทา
07:48
produceก่อ some utterancesคำพูด.
185
456173
1929
ทำการเปล่งเสียง
07:50
What she can produceก่อ are mostlyส่วนใหญ่ vowel-likeสระเหมือน soundsเสียง,
186
458102
2379
สิ่งที่เธอสามารถทำได้มันจะเป็นเสียงสระ
07:52
but that's enoughพอ for us to extractสารสกัด
187
460481
2479
แต่มันก็เพียงพอสำหรับเราที่จะสกัด
07:54
her sourceแหล่ง characteristicsลักษณะ.
188
462960
2285
แหล่งที่มาของลักษณะตัวตนของเธอ
07:57
What happensที่เกิดขึ้น nextต่อไป is bestดีที่สุด describedอธิบาย
189
465245
3271
สิ่งที่เกิดขึ้นต่อไปนั้น มีการอธิบายไว้เป็นอย่างดี
08:00
by my daughter'sลูกสาวของ analogyการเปรียบเทียบ. She's sixหก.
190
468516
2767
ด้วยการบรรยายเชิงอุปมาของลูกสาวของฉัน
อายุหกขวบ
08:03
She callsโทร it mixingการผสม colorsสี to paintสี voicesเสียง.
191
471283
5422
เธอเรียกมันว่าผสมสีเพื่อวาดเสียง
08:08
It's beautifulสวย. It's exactlyอย่างแน่นอน that.
192
476705
2555
มันงดงาม และมันก็เป็นเช่นนั้น
08:11
Samantha'sซาแมนต้า voiceเสียงพูด is like a concentratedจดจ่อ sampleตัวอย่าง
193
479260
2860
เสียงของซาแมนทาเหมือนกับตัวอย่างเข้มข้น
08:14
of redสีแดง foodอาหาร dyeย้อม whichที่ we can infuseใส่
194
482120
2609
ของสีผสมอาหารสีแดงซึ่งเราสามารถทำให้มันซึมซาบ
08:16
into the recordingsบันทึก of her surrogateตัวแทน
195
484729
2540
เข้าไปในบันทึกของตัวแทนของเธอ
08:19
to get a pinkสีชมพู voiceเสียงพูด just like this.
196
487269
4387
เพื่อที่จะได้เสียงสีชมพู
08:23
(Videoวีดีโอ) Samanthaซาแมนต้า: AaaaaahAaaaaah.
197
491656
4491
(วีดีโอ) ซาแมนทา: อาาาาาาห์
08:28
RPRP: So now, Samanthaซาแมนต้า can say this.
198
496147
2808
รูเพล: ถึงตอนนี้ ซาแมนทาสามารถพูดได้ว่า
08:30
(Videoวีดีโอ) Samanthaซาแมนต้า: This voiceเสียงพูด is only for me.
199
498955
3069
วีดีโอ) ซาแมนทา: เสียงนี้สำหรับฉันเท่านั้น
08:34
I can't wait to use my newใหม่ voiceเสียงพูด with my friendsเพื่อน.
200
502024
6305
ฉันอดใจไม่ไหวที่จะใช้เสียงหใม่ของฉันกับเพื่อนๆ
08:40
RPRP: Thank you. (Applauseการปรบมือ)
201
508329
6417
รูเพล: ขอบคุณค่ะ (เสียงปรบมือ)
08:46
I'll never forgetลืม the gentleอ่อนโยน smileยิ้ม
202
514746
2333
ฉันจะไม่ลืมรอยยิ้มอันอ่อนโยน
08:49
that spreadกระจาย acrossข้าม her faceใบหน้า
203
517079
1902
ที่ฉาบไปทั่วใบหน้าของเธอ
08:50
when she heardได้ยิน that voiceเสียงพูด for the first time.
204
518981
3649
เมื่อเธอได้ยินเสียงนั้นเป็นครั้งแรก
08:54
Now there's millionsล้าน of people
205
522630
1882
ตอนนี้มีผู้คนหลายล้าน
08:56
around the worldโลก like Samanthaซาแมนต้า, millionsล้าน,
206
524512
2833
ทั่วโลกที่เป็นเหมือนซาแมนทา
08:59
and we'veเราได้ only begunเริ่ม to scratchเกา the surfaceพื้นผิว.
207
527345
3440
และพวกเรานั้นแค่เริ่มแบบผิวเผินเท่านั้นเอง
09:02
What we'veเราได้ doneเสร็จแล้ว so farห่างไกล is we have
208
530785
1642
สิ่งที่เราได้ทำมาก็คือ
09:04
a fewน้อย surrogateตัวแทน talkerstalkers from around the U.S.
209
532427
3859
เรามีผู้พูดตัวแทนจำนวนหนึ่งทั่วทั้งสหรัฐอเมริกาฯ
09:08
who have donatedบริจาค theirของพวกเขา voicesเสียง,
210
536286
1507
ผู้ซึ่งบริจาคเสียงของพวกเขา
09:09
and we have been usingการใช้ those
211
537793
1928
และพวกเราก็ได้ใช้มัน
09:11
to buildสร้าง our first fewน้อย personalizedส่วนบุคคล voicesเสียง.
212
539721
4472
ในการสร้างเสียงส่วนตัวเสียงแรกของเรา
09:16
But there's so much more work to be doneเสร็จแล้ว.
213
544193
1756
แต่มันยังมีอะไรอีกมากที่ต้องทำ
09:17
For Samanthaซาแมนต้า, her surrogateตัวแทน
214
545949
2188
สำหรับซาแมนทา ตัวแทนของเธอนั้น
09:20
cameมา from somewhereที่ไหนสักแห่ง in the Midwestมิดเวสต์, a strangerคนแปลกหน้า
215
548137
3046
มาจากทางตะวันตกส่วนกลาง เป็นคนแปลกหน้า
09:23
who gaveให้ her the giftของขวัญ of voiceเสียงพูด.
216
551183
3841
ผู้ซึ่งให้ของขวัญแห่งเสียงกับเธอ
09:27
And as a scientistนักวิทยาศาสตร์, I'm so excitedตื่นเต้น
217
555024
2153
และในฐานะนักวิทยาศาสตร์ ฉันก็ตื่นเต้นมาก
09:29
to take this work out of the laboratoryห้องปฏิบัติการ
218
557177
1935
ที่จะนำงานชิ้นนี้ออกจากห้องทดลอง
09:31
and finallyในที่สุด into the realจริง worldโลก
219
559112
1800
และในที่สุด เผยมันสู่โลกแห่งความจริง
09:32
so it can have real-worldโลกแห่งความจริง impactส่งผลกระทบ.
220
560912
3165
ดังนั้น มันมีอิทธิพลต่อโลกแห่งความเป็นจริงได้
09:36
What I want to shareหุ้น with you nextต่อไป
221
564077
1582
สิ่งที่ฉันต้องการจะแบ่งปันกับคุณต่อไปก็คือ
09:37
is how I envisionวาดภาพ takingการ this work
222
565659
2175
การที่ฉันจินตนาการถึงการนำงานนี้
09:39
to that nextต่อไป levelชั้น.
223
567834
2711
ไปสู่ระดับต่อไป
09:42
I imagineจินตนาการ a wholeทั้งหมด worldโลก of surrogateตัวแทน donorsผู้บริจาค
224
570545
3887
ฉันคิดถึงโลกทั้งใบที่ผู้บริจาคตัวแทน
09:46
from all walksเดิน of life, differentต่าง sizesขนาด, differentต่าง agesทุกเพศทุกวัย,
225
574432
3260
จากทุกสารทิศ ไม่ว่าจะใหญ่เล็กหรือมีอายุเท่าไร
09:49
comingมา togetherด้วยกัน in this voiceเสียงพูด driveขับรถ
226
577692
3058
เข้ามารวมตัวกันในการผลักดันทางเสียงนี้
09:52
to give people voicesเสียง
227
580750
2270
เพื่อที่จะให้เสียงกับผู้คน
09:55
that are as colorfulมีสีสัน as theirของพวกเขา personalitiesบุคลิก.
228
583020
3799
ซึ่งเสียงนั้นจะมีชีวิตชีวา ไม่ต่างจากบุคลิกภาพของพวกเขา
09:58
To do that as a first stepขั้นตอน,
229
586819
2300
สำหรับก้าวแรกนั้น
10:01
we'veเราได้ put togetherด้วยกัน this websiteเว็บไซต์, VocaliDVocaliD.orgorg,
230
589119
3275
เราต้องทำให้เว็บไซต์ VocaliD.org
10:04
as a way to bringนำมาซึ่ง togetherด้วยกัน those
231
592394
1624
เป็นวิธีการที่จะนำ
10:06
who want to joinร่วม us as voiceเสียงพูด donorsผู้บริจาค,
232
594018
2675
ผู้ที่ต้องการจะเข้าร่วมเป็นผู้บริจาคเสียงกับเรา
10:08
as expertiseความชำนาญ donorsผู้บริจาค,
233
596693
1772
ให้เป็นดั่งผู้บริจาคผู้เชี่ยวชาญ
10:10
in whateverอะไรก็ตาม way to make this visionวิสัยทัศน์ a realityความจริง.
234
598465
5339
ให้แนวคิดนี้เป็นรูปธรรม ไม่ว่าทางใดก็ตาม
10:15
They say that givingให้ bloodเลือด can saveประหยัด livesชีวิต.
235
603804
4153
พวกเขาบอกว่าการบริจาคเลือดสามารถรักษาชีวิตได้
10:19
Well, givingให้ your voiceเสียงพูด can changeเปลี่ยนแปลง livesชีวิต.
236
607957
4982
การให้เสียงของคุณนั้น ก็สามารถเปลี่ยนชีวิตได้
10:24
All we need is a fewน้อย hoursชั่วโมง of speechการพูด
237
612939
3050
ทั้งหมดที่เราต้องการก็เพียงเวลาไม่กี่ชั่วโมงในการพูด
10:27
from our surrogateตัวแทน talkerนักพูด,
238
615989
1491
โดยผู้พูดตัวแทนของเรา
10:29
and as little as a vowelสระ from our targetเป้า talkerนักพูด,
239
617480
4733
และแค่เพียงสระจากผู้พูดเป้าหมายของเรา
10:34
to createสร้าง a uniqueเป็นเอกลักษณ์ vocalเกี่ยวกับเสียงพูด identityเอกลักษณ์.
240
622213
3711
ที่จะสร้างเสียงที่มีเอกลักษณ์เฉพาะได้
10:37
So that's the scienceวิทยาศาสตร์ behindหลัง what we're doing.
241
625924
2626
นั่นเป็นศาสตร์เบื้องหลังสิ่งที่เรากำลังทำอยู่
10:40
I want to endปลาย by circlingการเดินทางรอบ back to the humanเป็นมนุษย์ sideด้าน
242
628550
4455
ฉันอยากจะจบเรื่องนี้โดยย้อนกลับไป
ยังด้านที่เป็นมนุษย์
10:45
that is really the inspirationแรงบันดาลใจ for this work.
243
633005
4102
นั่นเป็นแรงบันดาลใจที่แท้จริงของงานนี้
10:49
About fiveห้า yearsปี agoมาแล้ว, we builtสร้างขึ้น our very first voiceเสียงพูด
244
637107
3699
ประมาณห้าปีก่อน เราสร้างเสียงแรกของเรา
10:52
for a little boyเด็กผู้ชาย namedชื่อ Williamวิลเลียม.
245
640806
2501
สำหรับเด็กผู้ชายตัวเล็กๆ ชื่อว่า วิลเลี่ยม
10:55
When his momแม่ first heardได้ยิน this voiceเสียงพูด,
246
643307
2357
เมื่อแม่ของเขาได้ยินมันเป็นครั้งแรก
10:57
she said, "This is what Williamวิลเลียม
247
645664
2345
เธอพูดว่า "วิลเลี่ยมน่าจะ
11:00
would have soundedฟัง like
248
648009
1546
มีเสียงแบบนี้แหละ
11:01
had he been ableสามารถ to speakพูด."
249
649555
2449
ถ้าเขานั้นพูดได้"
11:04
And then I saw Williamวิลเลียม typingการพิมพ์ a messageข่าวสาร
250
652004
2418
และเมื่อฉันได้เห็นวิลเลี่ยนพิมพ์ข้อความ
11:06
on his deviceเครื่อง.
251
654422
1362
บนอุปกรณ์ของเขา
11:07
I wonderedสงสัย, what was he thinkingคิด?
252
655784
3293
ฉันก็สงสัย ว่าเขาคิดอะไรอยู่นะ
11:11
Imagineจินตนาการ carryingการปฏิบัติ around someoneบางคน else'sอื่น voiceเสียงพูด
253
659077
3590
ลองจินตนาการถึงการที่คุณมีเสียงของใครสักคน
11:14
for nineเก้า yearsปี
254
662667
2193
มานานเก้าปี
11:16
and finallyในที่สุด findingคำวินิจฉัย your ownด้วยตัวเอง voiceเสียงพูด.
255
664860
4844
และในที่สุดก็ได้พบกับเสียงของตัวคุณเอง
11:21
Imagineจินตนาการ that.
256
669704
1377
ลองคิดดูสิ
11:23
This is what Williamวิลเลียม said:
257
671081
2797
นี่คือสิ่งที่วิลเลี่ยมพูด
11:25
"Never heardได้ยิน me before."
258
673878
4463
"ไม่เคยได้ยินผมมาก่อนเลย"
11:32
Thank you.
259
680417
1619
ขอบคุณค่ะ
11:34
(Applauseการปรบมือ)
260
682036
4724
(เสียงปรบมือ)

▲Back to top

ABOUT THE SPEAKER
Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee