ABOUT THE SPEAKER
Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com
TEDWomen 2013

Rupal Patel: Synthetic voices, as unique as fingerprints

روپال پاتل: صداهای ساختگی، منحصر به فرد به اندازه اثرات انگشت

Filmed:
944,754 views

بسیاری از افرادی که ناهنجاری های شدید گفتاری دارند برای ارتباط برقرار کردن از یک وسیله کامپیوتری استفاده می کنند. هنوز آنها تنها تعداد کمی صدا برای انتخاب دارند. به همین علت است که استفان هاوکینگ یک لهجه آمریکایی دارد، و به همین دلیل است که بسیاری از افراد به صدای یکسانی می رسند که اغلب اثر نامناسبی دارد. محقق گفتار، روپال پاتل خواست برای این مسئله کاری انجام دهد، و در این گفتگوی شگفت انگیز او کار خود را برای مهندسی صدایی منحصر به فرد برای افراد بدون صدا، به اشتراک می‌گذارد.
- Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that. Full bio

Double-click the English transcript below to play the video.

00:12
I'd like to talk todayامروز
0
719
1490
من امروز می خواهم
00:14
about a powerfulقدرتمند and fundamentalاساسی aspectجنبه
1
2209
2927
درباره این جنبه قدرتمند و اساسی از اینکه کی هستیم،
00:17
of who we are: our voiceصدای.
2
5136
3598
صحبت کنم: صدای ما.
00:20
Eachهر یک one of us has a uniqueمنحصر بفرد voiceprintصدای زنگ
3
8734
2746
هر یک از ما صدای منحصر به فرد خود را داریم
00:23
that reflectsبازتاب می دهد our ageسن, our sizeاندازه,
4
11480
2289
که منعکس کننده سن، اندازه
00:25
even our lifestyleسبک زندگی and personalityشخصیت.
5
13769
3237
حتی شیوه زندگی و شخصیت ما است.
00:29
In the wordsکلمات of the poetشاعر LongfellowLongfellow,
6
17006
2142
به گفته لانگ فلو شاعر
00:31
"the humanانسان voiceصدای is the organعضو of the soulروح."
7
19148
3870
"صدای انسان عضو روح است".
00:35
As a speechسخنرانی - گفتار scientistدانشمند, I'm fascinatedمجذوب
8
23018
2747
به عنوان یک محقق گفتار؛ من شیفته
00:37
by how the voiceصدای is producedتولید شده,
9
25765
1829
چگونگی تولید صدا هستم،
00:39
and I have an ideaاندیشه for how it can be engineeredمهندسی شده.
10
27594
3658
و من ایده ای در مورد چگونگی مهندسی صدا دارم.
00:43
That's what I'd like to shareاشتراک گذاری with you.
11
31252
2210
این چیزی است که دوست دارم با شما به اشتراک بگذارم.
00:45
I'm going to startشروع کن by playingبازی کردن you a sampleنمونه
12
33462
1814
من می خواهم با اجرای یک نمونه صدا برای شما شروع کنم،
00:47
of a voiceصدای that you mayممکن است recognizeتشخیص.
13
35276
1871
صدایی شما ممکن است بشناسید.
00:49
(Recordingضبط) Stephenاستفان Hawkingهاوکینگ: "I would have thought
14
37147
1304
(صدای ضبط) استفان هاوکینگ: "من فکر می کردم
00:50
it was fairlyمنصفانه obviousآشکار what I meantبه معنای."
15
38451
2749
منظورم کاملا واضح باشد."
00:53
Rupalروپال Patelپاتل: That was the voiceصدای
16
41200
1280
روپال پاتل: صدای
00:54
of Professorاستاد Stephenاستفان Hawkingهاوکینگ.
17
42480
2086
پروفسور استفان هاوکینگ بود.
00:56
What you mayممکن است not know is that sameیکسان voiceصدای
18
44566
3849
چیزی که ممکن است شما ندانیداین است که شاید همین صدای
01:00
mayممکن است alsoهمچنین be used by this little girlدختر
19
48415
2478
توسط این دختر کوچک نیز استفاده شود
01:02
who is unableناتوان to speakصحبت
20
50893
1697
که به علت شرایط عصبی
01:04
because of a neurologicalعصبی conditionوضعیت.
21
52590
2597
قادر به صحبت نیست.
01:07
In factواقعیت, all of these individualsاشخاص حقیقی
22
55187
2068
در حقیقت، تمام این افراد
01:09
mayممکن است be usingاستفاده كردن the sameیکسان voiceصدای,
23
57255
2012
ممکن است از صدای مشابهی استفاده کنند،
01:11
and that's because there's
only a fewتعداد کمی optionsگزینه ها availableدر دسترس است.
24
59267
3557
و این مسئله به این علت است که تنها موارد انتخاب کمی در دسترس است.
01:14
In the U.S. aloneتنها, there are 2.5 millionمیلیون Americansآمریکایی ها
25
62824
4317
فقط در آمریکا، ۲/۵ میلیون آمریکایی وجود دارد
01:19
who are unableناتوان to speakصحبت,
26
67141
1610
که قادر به صحبت نیستند،
01:20
and manyبسیاری of whomچه کسی use computerizedکامپیوتری devicesدستگاه ها
27
68751
2622
و بسیاری از آنها از وسایل کامپیوتری برای ارتباط
01:23
to communicateبرقراری ارتباط.
28
71373
1522
برقرار کردن استفاده می کنند.
01:24
Now that's millionsمیلیون ها نفر of people worldwideدر سراسر جهان
29
72895
3479
هم اکنون میلیون ها فرد در سراسر جهان هستند
01:28
who are usingاستفاده كردن genericعمومی voicesصدای,
30
76374
1652
که از صداهای عمومی استفاده می کنند،
01:30
includingشامل Professorاستاد Hawkingهاوکینگ,
31
78026
1446
از جمله صدای پروفسور هاوکینگ
01:31
who usesاستفاده می کند an American-accentedآمریکایی با لهجه voiceصدای.
32
79472
4833
که از صدایی با لهجه آمریکایی استفاده می کند.
01:36
This lackعدم of individuationفردا of the syntheticمصنوعی voiceصدای
33
84305
3328
این کمبود ساخت صداهای مصنوعی برای هر فرد
01:39
really hitاصابت home
34
87633
1416
زمانی واقعا اهمیتش برای من مشخص شد
01:41
when I was at an assistiveکمک کننده technologyتکنولوژی conferenceکنفرانس
35
89049
2472
که در کنفرانس تکنولوژی کمک رسان بودم
01:43
a fewتعداد کمی yearsسالها agoپیش,
36
91521
1850
چند سال قبل
01:45
and I recallبه خاطر آوردن walkingپیاده روی into an exhibitنمایشگاه hallسالن
37
93371
3604
و به یاد می آورم که در تالار نمایش راه می رفتم
01:48
and seeingدیدن a little girlدختر and a grownرشد کرد man
38
96975
3044
و یک دختر کوچک و یک مرد بالغ را دیدم
01:52
havingداشتن a conversationگفتگو usingاستفاده كردن theirخودشان devicesدستگاه ها,
39
100019
2916
که با استفاده از دستگاهایشان با هم گفتگو می کردند،
01:54
differentناهمسان devicesدستگاه ها, but the sameیکسان voiceصدای.
40
102935
4284
دستگاه های مختلف، اما صدای یکسان.
01:59
And I lookedنگاه کرد around and I saw this happeningاتفاق می افتد
41
107219
1909
و من به اطراف نگاه کردم و دیدم این مسئله
02:01
all around me, literallyعینا hundredsصدها of individualsاشخاص حقیقی
42
109128
4190
در تمام اطراف من رخ می دهد، به معنی واقعی کلمه صدها نفر
02:05
usingاستفاده كردن a handfulتعداد انگشت شماری of voicesصدای,
43
113318
2738
از تعداد کمی صدا استفاده می کردند،
02:08
voicesصدای that didn't fitمناسب theirخودشان bodiesبدن
44
116056
3091
صداهایی که مناسب بدن
02:11
or theirخودشان personalitiesشخصیت ها.
45
119147
2082
و شخصیت آنها نبود.
02:13
We wouldn'tنمی خواهم dreamرویا of fittingمناسب a little girlدختر
46
121229
2727
ما نمی توانیم تصور کنیم که
02:15
with the prostheticپروتز limbاندام of a grownرشد کرد man.
47
123956
3396
اعضای مصنوعی یک مرد بالغ برای یک دختر کوچک متناسب باشد.
02:19
So why then the sameیکسان prostheticپروتز voiceصدای?
48
127352
3304
بنابراین چرا صدای مصنوعی یکسانی را برای آنها تصور می کنیم؟
02:22
It really struckرخ داد me,
49
130656
1291
این مسئله واقعا من را به فکر واداشت
02:23
and I wanted to do something about this.
50
131947
3151
و تصمیم گرفتم کاری در آن باره انجام دهم.
02:27
I'm going to playبازی you now a sampleنمونه
51
135098
1953
من حالا می خواهم یک نمونه
02:29
of someoneکسی who has, two people actuallyدر واقع,
52
137051
3288
از صدای فردی که، در واقع دو نفر،
02:32
who have severeشدید speechسخنرانی - گفتار disordersاختلالات.
53
140339
1768
که ناهنجاری گفتاری شدید دارند را برای شما پخش کنم.
02:34
I want you to take a listen to how they soundصدا.
54
142107
3230
از شما می خواهم گوش کنید که صدای آنها چطور به نظر می رسد.
02:37
They're sayingگفت: the sameیکسان utteranceسخن گفتن.
55
145337
2357
آنها دارند سخن یکسانی را می گویند.
02:39
(First voiceصدای)
56
147694
2432
(صدای اول)
02:42
(Secondدومین voiceصدای)
57
150126
3617
(صدای دوم)
02:45
You probablyشاید didn't understandفهمیدن what they said,
58
153743
2412
شما احتمالا نفهمیدید که آنها چه گفتند،
02:48
but I hopeامید that you heardشنیدم
59
156155
1854
اما امیدوارم که شما
02:50
theirخودشان uniqueمنحصر بفرد vocalآواز identitiesهویت ها.
60
158009
4283
هویت صوتی منحصربه فرد آنها را شنیده باشید.
02:54
So what I wanted to do nextبعد is,
61
162292
2813
بنابراین چیزی که در مرحله بعد خواستم انجام دهم این است که
02:57
I wanted to find out how we could harnessمهار کردن
62
165105
2384
خواستم بفهمم که چطور ما می توانیم
02:59
these residualباقی مانده vocalآواز abilitiesتوانایی ها
63
167489
1821
این توانایی های صوتی باقی مانده را کنترل کنیم و
03:01
and buildساختن a technologyتکنولوژی
64
169310
2016
تکنولوژی را بسازیم
03:03
that could be customizedسفارشی for them,
65
171326
2143
که قابل انطباق برای نیاز آنها باشد،
03:05
voicesصدای that could be customizedسفارشی for them.
66
173469
2429
صداهایی که بتواند برای نیاز آنها قابل تغییر باشد.
03:07
So I reachedرسیده است out to my collaboratorمشارکت کننده, Timتیم Bunnellبونل.
67
175898
2685
بنابراین من علاقه‌ام را به همکارم، تیم بانل نشان دادم.
03:10
Drدکتر. Bunnellبونل is an expertکارشناس in speechسخنرانی - گفتار synthesisسنتز,
68
178583
3063
دکتر بانل یک متخصص در ساخت گفتار است
03:13
and what he'dاو می خواهد been doing is buildingساختمان
69
181646
2033
و کاری که انجام می دهد ساخت
03:15
personalizedشخصی voicesصدای for people
70
183679
1881
صداهای شخصی سازی شده برای افراد است
03:17
by puttingقرار دادن togetherبا یکدیگر
71
185560
2097
که این کار را با جمع آوری
03:19
pre-recordedپیش ضبط شده samplesنمونه ها of theirخودشان voiceصدای
72
187657
2150
نمونه های از پیش ضبط شده صدای افراد
03:21
and reconstructingبازسازی a voiceصدای for them.
73
189807
2879
و بازسازی صدایی برای آنها انجام می دهد.
03:24
These are people who had lostکم شده theirخودشان voiceصدای
74
192686
1712
اینها افرادی هستند که
03:26
laterبعد in life.
75
194398
1911
بعدها در زندگی صدایشان را از دست داده بودند.
03:28
We didn't have the luxuryلوکس
76
196309
1394
ما نعمت نمونه های
03:29
of pre-recordedپیش ضبط شده samplesنمونه ها of speechسخنرانی - گفتار
77
197703
1774
صداهای از پیش ضبط شده گفتار را نداشتیم
03:31
for those bornبدنیا آمدن with speechسخنرانی - گفتار disorderاختلال.
78
199477
2292
برای افرادی که با ناهنجاری های گفتاری به دنیا آمده اند
03:33
But I thought, there had to be a way
79
201769
2537
اما فکر کردم باید راهی باشد
03:36
to reverseمعکوس engineerمهندس a voiceصدای
80
204306
1944
برای مهندسی معکوس یک صدا
03:38
from whateverهر چه little is left over.
81
206250
2291
از هر چند مقداری اندکیکه باقی مانده است.
03:40
So we decidedقرار بر این شد to do exactlyدقیقا that.
82
208541
2714
بنابراین تصمیم گرفتیم دقیقا همین کار را بکنیم.
03:43
We setتنظیم out with a little bitبیت of fundingمنابع مالی
from the Nationalملی Scienceعلوم پایه Foundationپایه,
83
211255
3403
ما کار خود را با یافته های کمی از بنیاد ملی علوم آغاز کردیم
03:46
to createايجاد كردن custom-craftedسفارشی voicesصدای that capturedاسیر
84
214658
3565
تا صداهای دستساز مخصوص این افراد را بسازیم
03:50
theirخودشان uniqueمنحصر بفرد vocalآواز identitiesهویت ها.
85
218223
1536
که از هویت صوتی منحصر به فرد آنها گرفته شده باشد.
03:51
We call this projectپروژه VocaliDVocaliD, or vocalآواز I.D.,
86
219759
3203
ما این پروژه را وکالید یا وکال آی. دی نامیدیم
03:54
for vocalآواز identityهویت.
87
222962
2033
برای هویت صوتی.
03:56
Now before I get into the detailsجزئیات of how
88
224995
2674
حالا قبل از اینکه من وارد جزئیاتی شوم
03:59
the voiceصدای is madeساخته شده and let you listen to it,
89
227669
2048
که چطور این صدا ساخته شده است و بگذارم این صدا را گوش دهید،
04:01
I need to give you a realواقعی quickسریع
speechسخنرانی - گفتار scienceعلوم پایه lessonدرس. Okay?
90
229717
3350
لازم است یک درس واقعا سریع از علم گفتار به شما بدهم.
04:05
So first, we know that the voiceصدای is changingتغییر دادن
91
233067
3159
خب،ابتدا، ما می دانیم که صدا
04:08
dramaticallyبه طور چشمگیری over the courseدوره of developmentتوسعه.
92
236226
2854
در طی مسیر رشد به طور چشمگیری تغییر می کند.
04:11
Childrenفرزندان soundصدا differentناهمسان from teensنوجوانان
93
239080
2090
صدای بچه ها از نوجوانان متفاوت است
04:13
who soundصدا differentناهمسان from adultsبزرگسالان.
94
241170
1463
و صدای نوجوانان از افراد مسن متفاوت می باشد.
04:14
We'veما هستیم all experiencedبا تجربه this.
95
242633
2642
همه ما این مسئله را تجربه کرده ایم.
04:17
Factحقیقت numberعدد two is that speechسخنرانی - گفتار
96
245275
3363
حقیقت شماره دو این است که گفتار
04:20
is a combinationترکیبی of the sourceمنبع,
97
248638
2553
ترکیبی از منبع است
04:23
whichکه is the vibrationsارتعاشات generatedتولید شده است by your voiceصدای boxجعبه,
98
251191
3479
که منبع ارتعاشات تولید شده از جعبه صدا است،
04:26
whichکه are then pushedتحت فشار قرار داد throughاز طریق
99
254670
1939
که سپس این ارتعاشات
04:28
the restباقی مانده of the vocalآواز tractدستگاه.
100
256609
2437
به بقیه سیستم صوتی رانده می شوند.
04:31
These are the chambersاتاق ها of your headسر and neckگردن
101
259046
2484
محفظه هایی در سر و گردن شما وجود دارد
04:33
that vibrateارتعاش,
102
261530
1239
که ارتعاش می کنند
04:34
and they actuallyدر واقع filterفیلتر کردن that sourceمنبع soundصدا
103
262769
2110
و آنها در واقع صدای منبع را فیلتر می کنند
04:36
to produceتولید کردن consonantsهمخوانها and vowelsواکه.
104
264879
2537
تا حروف بی صدا و صدا دار تولید شوند.
04:39
So the combinationترکیبی of sourceمنبع and filterفیلتر کردن
105
267416
3860
بنابراین ترکیب منبع و فیلتر،
04:43
is how we produceتولید کردن speechسخنرانی - گفتار.
106
271276
2630
روشی است که ما گفتار را تولید می کنیم.
04:45
And that happensاتفاق می افتد in one individualفردی.
107
273906
3026
و این مسئله در هر فرد رخ می دهد.
04:48
Now I told you earlierقبلا that I'd spentصرف شده
108
276932
2626
حالا، من قبلا به شما گفتم که
04:51
a good partبخشی of my careerحرفه
109
279558
2025
یک قسمت خوب از کارم را صرف
04:53
understandingدرك كردن and studyingدر حال مطالعه
110
281583
2453
فهمیدن و مطالعه کردن
04:56
the sourceمنبع characteristicsمشخصات of people
111
284036
1958
مشخصه های منبع افرادی
04:57
with severeشدید speechسخنرانی - گفتار disorderاختلال,
112
285994
2301
با ناهنجاری های گفتاری شدید کردم،
05:00
and what I've foundپیدا شد
113
288295
1465
و چیزی که فهمیدم
05:01
is that even thoughگرچه theirخودشان filtersفیلترها were impairedضعیف,
114
289760
3366
این است که با وجود اینکه فیلتر این افراد آسیب دیده بود،
05:05
they were ableتوانایی to modulateمدولاسیون theirخودشان sourceمنبع:
115
293126
2961
آنها قادر بودند منبع خود را تنظیم کنند:
05:08
the pitchگام صدا, the loudnessصدای بلند, the tempoسرعت of theirخودشان voiceصدای.
116
296087
3262
زیر و بمی صدا، بلندی، سرعت صدایشان.
05:11
These are calledبه نام prosodyپرونده, and
I've been documentingمستندسازی for yearsسالها
117
299349
3368
به این مسئله الگو و ریتم صدا می گویند، و من سالها مستندسازی کرده‌ام که
05:14
that the prosodicاسرارآمیز abilitiesتوانایی ها of these individualsاشخاص حقیقی
118
302717
2277
توانایی الگو و ریتم صدای این افراد
05:16
are preservedحفظ شده است.
119
304994
1575
حفظ می شود.
05:18
So when I realizedمتوجه شدم that those sameیکسان cuesنشانه
120
306569
4087
بنابراین وقتی فهمیدم که آن نشانه
05:22
are alsoهمچنین importantمهم for speakerبلندگو identityهویت,
121
310656
2769
نیز برای هویت صحبت کننده مهم هستند،
05:25
I had this ideaاندیشه.
122
313425
2015
این ایده را داشتم
05:27
Why don't we take the sourceمنبع
123
315440
2516
چرا ما منبع را
05:29
from the personفرد we want the voiceصدای to soundصدا like,
124
317956
2213
از فردی که می خواهیم صدا، شبیه به صدای او باشد نگیریم
05:32
because it's preservedحفظ شده است,
125
320169
1463
زیرا منبع آنها حفظ شده است
05:33
and borrowامانت گرفتن the filterفیلتر کردن
126
321632
2135
چرا فیلتر را
05:35
from someoneکسی about the sameیکسان ageسن and sizeاندازه,
127
323767
3229
از فردی که حدودا سن و اندازه مشابهی دارد، قرض نگیریم
05:39
because they can articulateبیان speechسخنرانی - گفتار,
128
327011
2407
زیرا آنها می توانند گفتار را واضح و شمرده سازند
05:41
and then mixمخلوط کردن them?
129
329418
1791
و سپس آنها را ترکیب کنیم؟
05:43
Because when we mixمخلوط کردن them,
130
331209
1787
زیرا وقتی ما آنها را مخلوط کنیم
05:44
we can get a voiceصدای that's as clearروشن است
131
332996
1698
می توانیم به صدایی به واضحی
05:46
as our surrogateجایگزین talkerگفتگو --
132
334694
1754
سخن گویان جایگزین مان برسیم
05:48
that's the personفرد we borrowedقرض گرفت the filterفیلتر کردن from—
133
336448
2595
-فردی که ما فیلتر را از او قرض گرفتیم-
05:51
and is similarمشابه in identityهویت to our targetهدف talkerگفتگو.
134
339043
4649
و ماهیت آن به سخن گوی هدفمان شبیه است.
05:55
It's that simpleساده.
135
343692
1427
مسئله به همین سادگی است.
05:57
That's the scienceعلوم پایه behindپشت what we're doing.
136
345119
2934
این مسئله علمی پشت چیزی است که ما انجام دادیم.
06:00
So onceیک بار you have that in mindذهن,
137
348053
3533
بنابراین وقتی شما این مسئله را در نظر داشته باشید
06:03
how do you go about buildingساختمان this voiceصدای?
138
351586
2258
شما چطور ساخت این صدا را شروع می کنید؟
06:05
Well, you have to find someoneکسی
139
353844
1480
خب
06:07
who is willingمایلم to be a surrogateجایگزین.
140
355324
2400
شما باید فردی را پیدا کنید که تمایل داشته باشد فرد جانشین باشد.
06:09
It's not suchچنین an ominousشوم thing.
141
357724
2264
این مسئله چیز ناخوشایندی نیست.
06:11
Beingبودن a surrogateجایگزین donorاهدا کننده
142
359988
1523
یک دهنده جانشین بودن
06:13
only requiresنیاز دارد you to say a fewتعداد کمی hundredصد
143
361511
2788
تنها نیازمند این است که شما
06:16
to a fewتعداد کمی thousandهزار utterancesسخنان.
144
364299
2242
چند صد تا چند هزار سخن را بگویید.
06:18
The processروند goesمی رود something like this.
145
366541
2003
این فرآیند همانند چیزی شبیه به این پیش می رود
06:20
(Videoویدئو) Voiceصدای: Things happenبه وقوع پیوستن in pairsجفت.
146
368544
2190
چیزها بصورت جفت اتفاق می افتند
06:22
I love to sleepبخواب.
147
370734
1925
من دوست دارم بخوابم
06:24
The skyآسمان is blueآبی withoutبدون cloudsابرها.
148
372659
3882
آسمان آبی بدون ابر است.
06:28
RPRP: Now she's going to go on like this
149
376541
2002
حالا او به همین صورت
06:30
for about threeسه to fourچهار hoursساعت ها,
150
378543
1919
برای سه تا چهار ساعت ادامه می دهد
06:32
and the ideaاندیشه is not for her to say everything
151
380462
3005
و تصور این نیست که او
06:35
that the targetهدف is going to want to say,
152
383467
2045
هر چیزی را بگوید که فرد هدف می خواهد بگوید.
06:37
but the ideaاندیشه is to coverپوشش all the differentناهمسان combinationsترکیبات
153
385512
3395
بلکه تصور این است که تمام ترکیب های مختلف
06:40
of the soundsبرای تلفن های موبایل that occurبه وقوع پیوستن in the languageزبان.
154
388907
3271
صداها که در یک زبان اتفاق می افتد، پوشش داده شود.
06:44
The more speechسخنرانی - گفتار you have,
155
392178
1638
هر چه شما گفتار بیشتری داشته باشید
06:45
the better soundingصدایی voiceصدای you're going to have.
156
393816
2305
صدای بهتری را خواهید داشت.
06:48
Onceیک بار you have those recordingsضبط,
157
396121
1673
وقتی که شما این صداهای ضبط شده را داشته باشید
06:49
what we need to do
158
397794
1413
چیزی که ما باید انجام دهیم
06:51
is we have to parseتجزیه these recordingsضبط
159
399207
2718
این است که باید این صداهای ضبط شده را
06:53
into little snippetsقطعه of speechسخنرانی - گفتار,
160
401925
2449
به قطعات کوچک گفتار تجزیه کنیم
06:56
one-یک- or two-soundدو صدایی combinationsترکیبات,
161
404374
2337
ترکیب یک-یا دو صدا
06:58
sometimesگاه گاهی even wholeکل wordsکلمات
162
406711
1883
گاهی حتی تمام کلمات
07:00
that startشروع کن populatingپر جمعیت a datasetمجموعه داده or a databaseبانک اطلاعاتی.
163
408594
4516
که شروع به جمع کردن یک مجموعه داده ها یا یک پایگاه داده می‌کند.
07:05
We're going to call this databaseبانک اطلاعاتی a voiceصدای bankبانک.
164
413110
3717
ما قصد داریم این پایگاه داده را بانک صدا بنامیم.
07:08
Now the powerقدرت of the voiceصدای bankبانک
165
416827
2096
حالا توانایی بانک صدا
07:10
is that from this voiceصدای bankبانک,
166
418923
2014
این است که از این بانک صدا
07:12
we can now say any newجدید utteranceسخن گفتن,
167
420937
2011
حالا می توانیم هر سخن جدیدی را بگوییم
07:14
like, "I love chocolateشکلات" --
168
422948
1424
مثل " من شکلات دوست دارم."
07:16
everyoneهر کس needsنیاز دارد to be ableتوانایی to say that—
169
424372
1739
هر کس نیاز دارد بتواند این جمله را بگوید.
07:18
fishماهی throughاز طریق that databaseبانک اطلاعاتی
170
426111
1831
جستجو در آن پایگاه داده
07:19
and find all the segmentsبخش ها necessaryلازم است
171
427942
1940
و پیدا کردن تمام بخش های
07:21
to say that utteranceسخن گفتن.
172
429882
1929
لازم برای گفتن آن سخن.
07:23
(Videoویدئو) Voiceصدای: I love chocolateشکلات.
173
431811
1789
(ویدیو) صدا: من شکلات دوست دارم
07:25
RPRP: So that's speechسخنرانی - گفتار synthesisسنتز.
174
433600
1391
بنابراین این ساخت گفتار است.
07:26
It's calledبه نام concatenativeconcatenative synthesisسنتز,
and that's what we're usingاستفاده كردن.
175
434991
2573
این مسئله ساخت الحاقی نام دارد و این چیزی است که ما از آن استفاده می کنیم.
07:29
That's not the novelرمان partبخشی.
176
437564
1533
این مسئله قسمت جدیدی نیست.
07:31
What's novelرمان is how we make it soundصدا
177
439097
2221
چیزی که جدید است، روشی است که
07:33
like this youngجوان womanزن.
178
441318
1457
ما آ نرا شبیه صدای این دختر جوان کردیم.
07:34
This is Samanthaسامانتا.
179
442775
1524
این سامانتا است.
07:36
I metملاقات کرد her when she was nineنه,
180
444299
2346
من او را وقتی 9 ساله بود ملاقات کردم
07:38
and sinceاز آنجا که then, my teamتیم and I
181
446645
1897
و از آن به بعد تیم من و من
07:40
have been tryingتلاش کن to buildساختن her a personalizedشخصی voiceصدای.
182
448542
2714
تلاش کردیم برای او یک صدای شخصی سازی شده بسازیم.
07:43
We first had to find a surrogateجایگزین donorاهدا کننده,
183
451256
3099
ما اول مجبور بودیم یک دهنده جانشین پیدا کنیم
07:46
and then we had to have Samanthaسامانتا
184
454355
1818
و سپس ما مجبور بودیم از سامانتا بخواهیم
07:48
produceتولید کردن some utterancesسخنان.
185
456173
1929
چند نطق تولید کند.
07:50
What she can produceتولید کردن are mostlyاغلب vowel-likeواکه مانند soundsبرای تلفن های موبایل,
186
458102
2379
چیزی که او می تواند تولید کند اکثرا صداهایی شبیه به حروف صدا دار است
07:52
but that's enoughکافی for us to extractاستخراج کردن
187
460481
2479
اما همان برای ما کافی بود تا
07:54
her sourceمنبع characteristicsمشخصات.
188
462960
2285
مشخصه های منبع او را استخراج کنیم
07:57
What happensاتفاق می افتد nextبعد is bestبهترین describedشرح داده شده
189
465245
3271
چیزی که بعدا رخ می دهد به بهترین صورت
08:00
by my daughter'sدختر است analogyتقلید. She's sixشش.
190
468516
2767
با قیاس دختر من توصیف می شود. او شش سال دارد.
08:03
She callsتماس می گیرد it mixingمخلوط کردن colorsرنگ ها to paintرنگ voicesصدای.
191
471283
5422
او این مسئله را مخلوط رنگ ها برای رنگ آمیزی صداها می خواند.
08:08
It's beautifulخوشگل. It's exactlyدقیقا that.
192
476705
2555
آن زیبا است. این مسئله واقعا همین است.
08:11
Samantha'sسامانتا voiceصدای is like a concentratedمتمرکز شده sampleنمونه
193
479260
2860
صدای سامانتا شبیه یک نمونه غلیظ از
08:14
of redقرمز foodغذا dyeرنگ whichکه we can infuseتزریق
194
482120
2609
رنگ خوراک قرمزی است که می توانیم آن را
08:16
into the recordingsضبط of her surrogateجایگزین
195
484729
2540
داخل صدای ضبط شده جانشین او بریزیم
08:19
to get a pinkرنگ صورتی voiceصدای just like this.
196
487269
4387
تا یک صدای صورتی دقیقا شبیه این بدست آوریم.
08:23
(Videoویدئو) Samanthaسامانتا: Aaaaaahآهیییییییی.
197
491656
4491
(ویدیو) سامانتا: آآآآآ
08:28
RPRP: So now, Samanthaسامانتا can say this.
198
496147
2808
RP: بنابراین حالا، سامانتا می تواند این را بگوید
08:30
(Videoویدئو) Samanthaسامانتا: This voiceصدای is only for me.
199
498955
3069
(ویدیو) سامانتا: این صدا فقط برای من است.
08:34
I can't wait to use my newجدید voiceصدای with my friendsدوستان.
200
502024
6305
من نمی توانم صبر کنم تا از صدای جدیدم با دوستانم استفاده کنم.
08:40
RPRP: Thank you. (Applauseتشویق و تمجید)
201
508329
6417
متشکرم (تشویق)
08:46
I'll never forgetفراموش کردن the gentleملایم smileلبخند
202
514746
2333
من هرگز آن لبخند ملایمی را
08:49
that spreadانتشار دادن acrossدر سراسر her faceصورت
203
517079
1902
که در سراسر صورت او گسترده شدفراموش نمی کنم
08:50
when she heardشنیدم that voiceصدای for the first time.
204
518981
3649
وقتی او برای اولین بار آن صدا را شنید.
08:54
Now there's millionsمیلیون ها نفر of people
205
522630
1882
حالا میلیون ها نفر
08:56
around the worldجهان like Samanthaسامانتا, millionsمیلیون ها نفر,
206
524512
2833
در سراسر دنیا شبیه ساماتا وجود دارد، میلیونها نفر
08:59
and we'veما هستیم only begunشروع شد to scratchخراش the surfaceسطح.
207
527345
3440
و ما تنها در ابتدای راه هستیم.
09:02
What we'veما هستیم doneانجام شده so farدور is we have
208
530785
1642
چیزی که ما تا کنون انجام داده ایم
09:04
a fewتعداد کمی surrogateجایگزین talkersسخنرانان from around the U.S.
209
532427
3859
این است که ما تعداد کمی سخن گوی جانشین از سراسر آمریکا داریم که
09:08
who have donatedاهدا شد theirخودشان voicesصدای,
210
536286
1507
صدایشان را اهدا کرده اند
09:09
and we have been usingاستفاده كردن those
211
537793
1928
و ما از آنها استفاده کرده ایم
09:11
to buildساختن our first fewتعداد کمی personalizedشخصی voicesصدای.
212
539721
4472
تا تعداد کمی از صداهای شخصی سازی شده اولیه مان را بسازیم.
09:16
But there's so much more work to be doneانجام شده.
213
544193
1756
اما کارهای بسیار بیشتری برای انجام دادن وجود دارد.
09:17
For Samanthaسامانتا, her surrogateجایگزین
214
545949
2188
برای سامانتا، جانشین او
09:20
cameآمد from somewhereجایی in the Midwestغرب میانه, a strangerغریبه
215
548137
3046
از جایی در ناحیه مرکزی آمریکا بود، یک غریبه
09:23
who gaveداد her the giftهدیه of voiceصدای.
216
551183
3841
که هدیه صدا را به او داد.
09:27
And as a scientistدانشمند, I'm so excitedبرانگیخته
217
555024
2153
و به عنوان یک محقق،بسیار هیجان زده هستم
09:29
to take this work out of the laboratoryآزمایشگاه
218
557177
1935
که این کار را به خارج از آزمایشگاه ببرم
09:31
and finallyسرانجام into the realواقعی worldجهان
219
559112
1800
و نهایتا آن را به دنیای واقعی وارد کنم
09:32
so it can have real-worldدنیای واقعی impactتأثیر.
220
560912
3165
در نتیجه این کار می تواند تاثیری در دنیای واقعی داشته باشد.
09:36
What I want to shareاشتراک گذاری with you nextبعد
221
564077
1582
چیزی که پس از آن من می خواهم با شما به اشتراک بگذارم
09:37
is how I envisionتجسم takingگرفتن this work
222
565659
2175
این است که من چه رویایی
09:39
to that nextبعد levelسطح.
223
567834
2711
برای بردن این کار به این سطح بعدی دارم.
09:42
I imagineتصور کن a wholeکل worldجهان of surrogateجایگزین donorsاهدا کنندگان
224
570545
3887
من کل دنیایی را از دهنده های جانشین تصور می کنم
09:46
from all walksپیاده روی می کند of life, differentناهمسان sizesاندازه ها, differentناهمسان agesسنین,
225
574432
3260
از تمام موقعیت های اجتماعی، اندازه های مختلف، سن های متفاوت،
09:49
comingآینده togetherبا یکدیگر in this voiceصدای driveراندن
226
577692
3058
که در این مسیر صدا با هم جمع شوند
09:52
to give people voicesصدای
227
580750
2270
تا به افراد صدایی دهند
09:55
that are as colorfulرنگارنگ as theirخودشان personalitiesشخصیت ها.
228
583020
3799
که به اندازه شخصیت های آنها رنگارنگ باشد.
09:58
To do that as a first stepگام,
229
586819
2300
برای انجام این کار به عنوان قدم اول،
10:01
we'veما هستیم put togetherبا یکدیگر this websiteسایت اینترنتی, VocaliDVocaliD.orgاردن,
230
589119
3275
ما این سایت اینترنتی را راه اندازی کرده ایم
VocaliD.org
10:04
as a way to bringآوردن togetherبا یکدیگر those
231
592394
1624
به عنوان مسیری برای جمع کردن آنهایی
10:06
who want to joinپیوستن us as voiceصدای donorsاهدا کنندگان,
232
594018
2675
که می خواهند به ما بپیوندند به عنوان دهنده صدا،
10:08
as expertiseتخصص donorsاهدا کنندگان,
233
596693
1772
به عنوان اهدا کننده مهارتشان،
10:10
in whateverهر چه way to make this visionچشم انداز a realityواقعیت.
234
598465
5339
یا هر راهی که این تصور را به واقعیت تبدیل کند.
10:15
They say that givingدادن bloodخون can saveصرفه جویی livesزندگی می کند.
235
603804
4153
گفته می شود که دادن خون می تواند زندگی ها را نجات دهد.
10:19
Well, givingدادن your voiceصدای can changeتغییر دادن livesزندگی می کند.
236
607957
4982
خب، دادن صدایتان می تواند زندگی ها را تغییر دهد.
10:24
All we need is a fewتعداد کمی hoursساعت ها of speechسخنرانی - گفتار
237
612939
3050
تمام چیزی که ما نیاز داریم چند ساعت گفتار
10:27
from our surrogateجایگزین talkerگفتگو,
238
615989
1491
از سخن گوی جانشین ما است،
10:29
and as little as a vowelحرف صدادار from our targetهدف talkerگفتگو,
239
617480
4733
و به مقدار کمی به اندازه یک حرف باصدا از سخن گوی هدفمان
10:34
to createايجاد كردن a uniqueمنحصر بفرد vocalآواز identityهویت.
240
622213
3711
تا یک هویت صدای منحصربه فرد بسازیم.
10:37
So that's the scienceعلوم پایه behindپشت what we're doing.
241
625924
2626
بنابراین این دانش پشت چیزی است که ما انجام می دهیم.
10:40
I want to endپایان by circlingچرخاندن back to the humanانسان sideسمت
242
628550
4455
من می خواهم سخنم را پایان دهم با برگشتن به جنبه انسانی
10:45
that is really the inspirationالهام بخش for this work.
243
633005
4102
که واقعا الهام بخش این کار بود.
10:49
About fiveپنج yearsسالها agoپیش, we builtساخته شده our very first voiceصدای
244
637107
3699
حدود پنج سال قبل، ما صدای بسیار اولیه ای خود را
10:52
for a little boyپسر namedتحت عنوان Williamویلیام.
245
640806
2501
برای یک پسر کوچک به نام ویلیام ساختیم.
10:55
When his momمامان first heardشنیدم this voiceصدای,
246
643307
2357
وقتی که مادرش اولین بار این صدا را شنید
10:57
she said, "This is what Williamویلیام
247
645664
2345
گفت، " این چیزی است که
11:00
would have soundedصدای like
248
648009
1546
شبیه صدای ویلیام می بود
11:01
had he been ableتوانایی to speakصحبت."
249
649555
2449
اگر او قادر بود حرف بزند."
11:04
And then I saw Williamویلیام typingتایپ کردن a messageپیام
250
652004
2418
و سپس من دیدم که ویلیام دارد
11:06
on his deviceدستگاه.
251
654422
1362
پیامی را روی دستگاهش تایپ می کند.
11:07
I wonderedشگفت زده, what was he thinkingفكر كردن?
252
655784
3293
من شگفت زده شدم، او داشت به چه فکر می کرد؟
11:11
Imagineتصور کن carryingحمل کردن around someoneکسی else'sچیز دیگری است voiceصدای
253
659077
3590
تصور کنید صدای فرد دیگری را به دوش بکشید
11:14
for nineنه yearsسالها
254
662667
2193
برای نه سال
11:16
and finallyسرانجام findingیافته your ownخودت voiceصدای.
255
664860
4844
و نهایتا صدای خودتان را پیدا کنید.
11:21
Imagineتصور کن that.
256
669704
1377
این را تصور کنید.
11:23
This is what Williamویلیام said:
257
671081
2797
این چیزی است که ویلیام گفت:
11:25
"Never heardشنیدم me before."
258
673878
4463
"قبلا هرگز صدای من را نشنیده بودید."
11:32
Thank you.
259
680417
1619
متشکرم
11:34
(Applauseتشویق و تمجید)
260
682036
4724
(تشویق)
Translated by s. sajadi
Reviewed by Leila Ataei

▲Back to top

ABOUT THE SPEAKER
Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com

Data provided by TED.

This site was created in May 2015 and the last update was on January 12, 2020. It will no longer be updated.

We are currently creating a new site called "eng.lish.video" and would be grateful if you could access it.

If you have any questions or suggestions, please feel free to write comments in your language on the contact form.

Privacy Policy

Developer's Blog

Buy Me A Coffee