ABOUT THE SPEAKER

Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com

TEDWomen 2013

Rupal Patel: Synthetic voices, as unique as fingerprints

Rupal Patel: Giọng nói cũng độc đáo như vân tay

Filmed: 2013-12-05

Readability: 3.9

944,754 views

Năng lực nói của nhiều người bị rối loạn nghiêm trọng nên họ phải dùng thiết bị máy tính để giao tiếp. Tuy nhiên người ta chỉ chon tập trung vào một số ít các giọng. Thế nên Stephen Hawking có giọng Mỹ, và nhiều người chọn cùng một giọng nói, dẫn đến hiệu ứng không thích hợp. Nhà khoa học về Giọng nói Rupal Patel muốn làm một điều gì đó trong việc này, trong câu chuyện, bà kể về việc chế ra những giọng nói riêng biệt duy nhất cho những người không nói được.

Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that. Full bio

Double-click the English transcript below to play the video.

00:12

I'd like to talk todayhôm nay

0

719

1490

Hôm nay tôi xin trình bày

00:14

about a powerfulquyền lực and fundamentalcăn bản aspectkhía cạnh

1

2209

2927

một khía cạnh căn bản
và mạnh mẽ trong

00:17

of who we are: our voicetiếng nói.

2

5136

3598

mỗi chúng ta: giọng nói.

00:20

EachMỗi one of us has a uniqueđộc nhất voiceprintvoiceprint

3

8734

2746

Mỗi người chúng ta
có một chất giọng độc đáo

00:23

that reflectsphản ánh our agetuổi tác, our sizekích thước,

4

11480

2289

phản ánh tuổi tác,
kích cỡ cơ thể,

00:25

even our lifestylelối sống and personalitynhân cách.

5

13769

3237

thậm chí phong cách sống và
nhân cách của mỗi người.

00:29

In the wordstừ ngữ of the poetnhà thơ LongfellowLongfellow,

6

17006

2142

Thơ của Longfellow đã nói rằng:

00:31

"the humanNhân loại voicetiếng nói is the organđàn organ of the soulLinh hồn."

7

19148

3870

"Giọng nói là âm điệu của tâm hồn."

00:35

As a speechphát biểu scientistnhà khoa học, I'm fascinatedquyến rũ

8

23018

2747

Là nhà nghiên cứu khoa học tiếng nói,
tôi bị hấp dẫn

00:37

by how the voicetiếng nói is producedsản xuất,

9

25765

1829

bởi cách giọng nói được cất lên,

00:39

and I have an ideaý kiến for how it can be engineeredthiết kế.

10

27594

3658

và cách nó
có thể được chế tạo.

00:43

That's what I'd like to sharechia sẻ with you.

11

31252

2210

Đó là câu chuyện tôi muốn chia sẻ.

00:45

I'm going to startkhởi đầu by playingđang chơi you a samplemẫu vật

12

33462

1814

Tôi sẽ cho các bạn
nghe một mẫu

00:47

of a voicetiếng nói that you mayTháng Năm recognizenhìn nhận.

13

35276

1871

giọng nói mà các bạn
có thế nhận ra.

00:49

(RecordingGhi âm) StephenStephen HawkingHawking: "I would have thought

14

37147

1304

(Băng) Stephen Hawking: "Tôi nghĩ
mình đã diễn đạt khá rõ điều muốn nói."

00:50

it was fairlycông bằng obvioushiển nhiên what I meantý nghĩa."

15

38451

2749

00:53

RupalRupal PatelPatel: That was the voicetiếng nói

16

41200

1280

Rupal Patel: Đó là giọng

00:54

of ProfessorGiáo sư StephenStephen HawkingHawking.

17

42480

2086

của Giáo sư Stephen Hawking.

00:56

What you mayTháng Năm not know is that sametương tự voicetiếng nói

18

44566

3849

Điều quý vị có thể không biết,
là giọng nói này

01:00

mayTháng Năm alsocũng thế be used by this little girlcon gái

19

48415

2478

cũng có thể được cô bé
này sử dụng

01:02

who is unablekhông thể to speaknói

20

50893

1697

cô không nói được

01:04

because of a neurologicalthần kinh conditionđiều kiện.

21

52590

2597

do mắc phải một bệnh thần kinh.

01:07

In factthực tế, all of these individualscá nhân

22

55187

2068

Thực tế là,
những người trên hình này

01:09

mayTháng Năm be usingsử dụng the sametương tự voicetiếng nói,

23

57255

2012

có thể đang
sử dụng cùng một giọng nói,

01:11

and that's because there's
only a fewvài optionslựa chọn availablecó sẵn.

24

59267

3557

đó là do họ chỉ có
một số ít các lựa chọn.

01:14

In the U.S. alonemột mình, there are 2.5 milliontriệu AmericansNgười Mỹ

25

62824

4317

Tính riêng ở Mỹ, có khoảng
2,5 triệu người

01:19

who are unablekhông thể to speaknói,

26

67141

1610

không thể nói,

01:20

and manynhiều of whomai use computerizedtrên máy vi tính devicesthiết bị

27

68751

2622

và nhiều người trong số họ
sử dụng các thiết bị máy tính

01:23

to communicategiao tiếp.

28

71373

1522

để giao tiếp.

01:24

Now that's millionshàng triệu of people worldwidetrên toàn thế giới

29

72895

3479

Có hàng triệu người trên trái đất
đang sử dụng những giọng nói chung,

01:28

who are usingsử dụng genericchung voicestiếng nói,

30

76374

1652

bao gồm giọng của
Giáo sư Hawking,

01:30

includingkể cả ProfessorGiáo sư HawkingHawking,

31

78026

1446

01:31

who usessử dụng an American-accentedNgười Mỹ có dấu voicetiếng nói.

32

79472

4833

giọng Mỹ đặc trưng.

01:36

This lackthiếu sót of individuationindividuation of the syntheticsợi tổng hợp voicetiếng nói

33

84305

3328

Khiếm khuyết về đặc điểm
cá nhân này của giọng nói nhân tạo

01:39

really hitđánh home

34

87633

1416

thực sự đã ám ảnh tôi

01:41

when I was at an assistivetrôï giuùp technologyCông nghệ conferencehội nghị

35

89049

2472

khi tham gia
một hội nghị kỹ thuật hỗ trợ

01:43

a fewvài yearsnăm agotrước,

36

91521

1850

cách đây vài năm,

01:45

and I recallhồi tưởng walkingđi dạo into an exhibittriển lãm hallđại sảnh

37

93371

3604

tôi còn nhớ khoảng khắc
thả bộ vào sảnh hội trường

01:48

and seeingthấy a little girlcon gái and a grownmới lớn man

38

96975

3044

và bắt gặp một cô bé con
cùng một người lớn

01:52

havingđang có a conversationcuộc hội thoại usingsử dụng theirhọ devicesthiết bị,

39

100019

2916

dùng thiết bị hỗ trợ
để nói chuyện với nhau,

01:54

differentkhác nhau devicesthiết bị, but the sametương tự voicetiếng nói.

40

102935

4284

thiết bị khác nhau,
nhưng cùng một giọng nói.

01:59

And I lookednhìn around and I saw this happeningxảy ra

41

107219

1909

Tôi quan sát và theo dõi

02:01

all around me, literallynghĩa đen hundredshàng trăm of individualscá nhân

42

109128

4190

quanh tôi, có hàng trăm người

02:05

usingsử dụng a handfulsố ít of voicestiếng nói,

43

113318

2738

đang dùng chỉ một vài giọng nói,

02:08

voicestiếng nói that didn't fitPhù hợp theirhọ bodiescơ thể

44

116056

3091

những giọng nói đó không hề
tương xứng với cơ thể

02:11

or theirhọ personalitiesnhân cách.

45

119147

2082

hoặc tính cách của họ.

02:13

We wouldn'tsẽ không dreammơ tưởng of fittinglắp a little girlcon gái

46

121229

2727

Chưa bao giờ nghĩ ta sẽ
nối tay hoặc chân giả

02:15

with the prostheticProsthetic limbchân tay of a grownmới lớn man.

47

123956

3396

của người trưởng thành
cho một cô bé gái.

02:19

So why then the sametương tự prostheticProsthetic voicetiếng nói?

48

127352

3304

Vậy tại sao lại chấp nhận
sử dụng giọng nói nhân tạo như thế?

02:22

It really strucktấn công me,

49

130656

1291

Nó thực sự dày vò tôi,

02:23

and I wanted to do something about this.

50

131947

3151

tôi muốn làm cái gì đó.

02:27

I'm going to playchơi you now a samplemẫu vật

51

135098

1953

Bây giờ tôi xin mở
một đoạn ví dụ

02:29

of someonengười nào who has, two people actuallythực ra,

52

137051

3288

của một người,
thực tế là hai,

mắc chứng rối loạn
giọng nói nghiêm trọng.

02:32

who have severenghiêm trọng speechphát biểu disordersrối loạn.

53

140339

1768

02:34

I want you to take a listen to how they soundâm thanh.

54

142107

3230

Tôi muốn các bạn
chú ý lắng nghe cách họ nói.

02:37

They're sayingnói the sametương tự utterancecâu phát biểu.

55

145337

2357

Họ đang diễn đạt cùng một ý.

02:39

(First voicetiếng nói)

56

147694

2432

(Giọng nói thứ nhất)

02:42

(SecondThứ hai voicetiếng nói)

57

150126

3617

(Giọng nói thứ 2)

02:45

You probablycó lẽ didn't understandhiểu không what they said,

58

153743

2412

Bạn có thể không hiểu
những gì họ nói,

02:48

but I hopemong that you heardnghe

59

156155

1854

nhưng tôi hy vọng
bạn có thể nhận ra

02:50

theirhọ uniqueđộc nhất vocalgiọng hát identitiesdanh tính.

60

158009

4283

đặc điểm riêng về giọng nói
của họ.

02:54

So what I wanted to do nextkế tiếp is,

61

162292

2813

Điều tiếp theo phải làm là,

02:57

I wanted to find out how we could harnesskhai thác

62

165105

2384

tôi muốn tìm ra cách tận dụng

02:59

these residualdư vocalgiọng hát abilitieskhả năng

63

167489

1821

khả năng nói chuyện
còn sót lại này

03:01

and buildxây dựng a technologyCông nghệ

64

169310

2016

và xây dựng một kỹ thuật

03:03

that could be customizedtùy chỉnh for them,

65

171326

2143

tương hợp với họ,

03:05

voicestiếng nói that could be customizedtùy chỉnh for them.

66

173469

2429

tạo ra giọng nói phù hợp nhất.

03:07

So I reachedđạt được out to my collaboratorcộng tác viên, TimTim BunnellBunnell.

67

175898

2685

Vì thế, tôi đã trao đổi
với đồng sự, Tim Bunnell.

03:10

DrTiến sĩ. BunnellBunnell is an expertchuyên gia in speechphát biểu synthesistổng hợp,

68

178583

3063

Tiến sĩ Bunnell là chuyên gia
trong lĩnh vực giọng nói nhân tạo,

03:13

and what he'danh ấy been doing is buildingTòa nhà

69

181646

2033

ông ấy đã và đang xây dựng

03:15

personalizedcá nhân hoá voicestiếng nói for people

70

183679

1881

giọng nói
mang đặc điểm cá nhân

03:17

by puttingđặt togethercùng với nhau

71

185560

2097

bằng cách ghép
những mẫu giọng nói của họ

03:19

pre-recordedtrước khi thu âm samplesmẫu of theirhọ voicetiếng nói

72

187657

2150

được ghi âm trước đó

03:21

and reconstructingxây dựng lại a voicetiếng nói for them.

73

189807

2879

và tái tạo giọng cho họ.

Đây là những người
mất đi giọng nói

03:24

These are people who had lostmất đi theirhọ voicetiếng nói

74

192686

1712

03:26

latermột lát sau in life.

75

194398

1911

trong những năm về sau
của cuộc đời.

03:28

We didn't have the luxurysang trọng

76

196309

1394

Chúng ta không có những

03:29

of pre-recordedtrước khi thu âm samplesmẫu of speechphát biểu

77

197703

1774

bản ghi âm tiếng nói

03:31

for those bornsinh ra with speechphát biểu disorderrối loạn.

78

199477

2292

của những người
mắc bệnh bẩm sinh.

03:33

But I thought, there had to be a way

79

201769

2537

Nhưng tôi nghĩ,
phải có một cách khác

03:36

to reverseđảo ngược engineerkỹ sư a voicetiếng nói

80

204306

1944

để tạo lại giọng nói

03:38

from whateverbất cứ điều gì little is left over.

81

206250

2291

từ bất kỳ thứ gì nhỏ nhoi
còn sót lại.

03:40

So we decidedquyết định to do exactlychính xác that.

82

208541

2714

Cuối cùng, chúng tôi quyết định
làm đúng như vậy.

03:43

We setbộ out with a little bitbit of fundingkinh phí
from the NationalQuốc gia ScienceKhoa học FoundationNền tảng,

83

211255

3403

Bắt đầu với nguồn quỹ ít ỏi
từ Quỹ Khoa học Quốc gia,

03:46

to createtạo nên custom-craftedCustom-crafted. voicestiếng nói that capturedbị bắt

84

214658

3565

để tạo ra
giọng nói nhân tạo tùy chỉnh

03:50

theirhọ uniqueđộc nhất vocalgiọng hát identitiesdanh tính.

85

218223

1536

dựa trên đặc điểm
từng người.

03:51

We call this projectdự án VocaliDVocaliD, or vocalgiọng hát I.D.,

86

219759

3203

Chúng tôi gọi dự án này là
VocaliD hay là vocal I.D

03:54

for vocalgiọng hát identitydanh tính.

87

222962

2033

tạo tiếng nói cá nhân.

03:56

Now before I get into the detailschi tiết of how

88

224995

2674

Trước khi đi vào chi tiết về
việc hình thành

03:59

the voicetiếng nói is madethực hiện and let you listen to it,

89

227669

2048

giọng nói
và để bạn có thể nghe thấy,

04:01

I need to give you a realthực quicknhanh chóng
speechphát biểu sciencekhoa học lessonbài học. Okay?

90

229717

3350

Tôi xin nói nhanh một bài khoa học
về giọng nói.

04:05

So first, we know that the voicetiếng nói is changingthay đổi

91

233067

3159

Trước tiên, chúng ta đều biết
giọng nói sẽ thay đổi nhiều

04:08

dramaticallyđột ngột over the coursekhóa học of developmentphát triển.

92

236226

2854

qua quá trình phát triển.

04:11

ChildrenTrẻ em soundâm thanh differentkhác nhau from teensthiếu niên

93

239080

2090

Trẻ em nói giọng
khác thanh thiếu niên

04:13

who soundâm thanh differentkhác nhau from adultsngười trưởng thành.

94

241170

1463

khác với giọng người lớn.

04:14

We'veChúng tôi đã all experiencedcó kinh nghiệm this.

95

242633

2642

Ai cũng đều trải qua
những thời kỳ đó.

04:17

FactThực tế numbercon số two is that speechphát biểu

96

245275

3363

Sự thật tiếp theo là
giọng nói

04:20

is a combinationsự phối hợp of the sourcenguồn,

97

248638

2553

là sự kết hợp
của âm nguồn,

04:23

whichmà is the vibrationsrung động generatedtạo ra by your voicetiếng nói boxcái hộp,

98

251191

3479

những nhịp rung được tạo ra
từ hộp âm thanh,

04:26

whichmà are then pushedđẩy throughxuyên qua

99

254670

1939

sau đó, được truyền qua

04:28

the restnghỉ ngơi of the vocalgiọng hát tractđường.

100

256609

2437

phần còn lại
của đường truyền tiếng.

04:31

These are the chambersChambers of your headcái đầu and neckcái cổ

101

259046

2484

Đây là những khoang
trong đầu và cổ

04:33

that vibratebaùo rung,

102

261530

1239

chúng sẽ rung lên,

04:34

and they actuallythực ra filterlọc that sourcenguồn soundâm thanh

103

262769

2110

và lọc những âm nguồn

04:36

to producesản xuất consonantsphụ âm and vowelsnguyên âm.

104

264879

2537

để phát ra
các nguyên âm và phụ âm.

04:39

So the combinationsự phối hợp of sourcenguồn and filterlọc

105

267416

3860

Như vậy, sự kết hợp
giữa âm nguồn và bộ lọc

04:43

is how we producesản xuất speechphát biểu.

106

271276

2630

là cách mà giọng nói
được phát ra.

04:45

And that happensxảy ra in one individualcá nhân.

107

273906

3026

Và quá trình đó xảy ra
ở từng cá nhân.

04:48

Now I told you earliersớm hơn that I'd spentđã bỏ ra

108

276932

2626

Ban nãy, tôi đã nói

04:51

a good partphần of my careernghề nghiệp

109

279558

2025

tôi dành nhiều thời gian
và công sức

04:53

understandinghiểu biết and studyinghọc tập

110

281583

2453

để hiểu và nghiên cứu

04:56

the sourcenguồn characteristicsđặc điểm of people

111

284036

1958

đặc điểm âm nguồn
của cá nhân

04:57

with severenghiêm trọng speechphát biểu disorderrối loạn,

112

285994

2301

mắc chứng rối loạn giọng nói
nghiêm trọng,

05:00

and what I've foundtìm

113

288295

1465

điều mà tôi tìm ra là

05:01

is that even thoughTuy nhiên theirhọ filtersbộ lọc were impairedbị khiếm khuyết,

114

289760

3366

mặc dù bộ lọc
bị hư hại và suy giảm,

05:05

they were ablecó thể to modulateđiều chỉnh theirhọ sourcenguồn:

115

293126

2961

họ vẫn có thể
tạo ra âm thanh nguồn:

05:08

the pitchsân cỏ, the loudnessâm sắc, the tempotiến độ of theirhọ voicetiếng nói.

116

296087

3262

gồm cao độ, cường độ, nhịp độ

05:11

These are calledgọi là prosodyYahoo!, and
I've been documentingghi chép for yearsnăm

117

299349

3368

gọi chung là âm điệu,
tôi đã nghiên cứu trong nhiều năm

05:14

that the prosodicprosodic abilitieskhả năng of these individualscá nhân

118

302717

2277

thấy rằng năng lực tạo âm điệu
của những người này vẫn còn được lưu giữ.

05:16

are preservedbảo quản.

119

304994

1575

05:18

So when I realizedthực hiện that those sametương tự cuestín hiệu

120

306569

4087

Vì thế, khi nhận ra
những tín hiệu này

05:22

are alsocũng thế importantquan trọng for speakerloa identitydanh tính,

121

310656

2769

là rất quan trọng
với giọng nói cá nhân,

05:25

I had this ideaý kiến.

122

313425

2015

tôi đã nảy ra ý tưởng.

05:27

Why don't we take the sourcenguồn

123

315440

2516

Sao không lấy âm nguồn

05:29

from the personngười we want the voicetiếng nói to soundâm thanh like,

124

317956

2213

từ chính người cần tạo giọng nói,

05:32

because it's preservedbảo quản,

125

320169

1463

vì nó vẫn còn được lưu giữ,

05:33

and borrowvay the filterlọc

126

321632

2135

rồi mượn bộ lọc

05:35

from someonengười nào about the sametương tự agetuổi tác and sizekích thước,

127

323767

3229

từ một người cùng tuổi
và kích cỡ,

05:39

because they can articulaterõ speechphát biểu,

128

327011

2407

vì họ có thể phát ra
giọng nói rõ ràng,

05:41

and then mixpha trộn them?

129

329418

1791

rồi kết hợp chúng lại?

05:43

Because when we mixpha trộn them,

130

331209

1787

Làm thế, chúng ta có thể

05:44

we can get a voicetiếng nói that's as cleartrong sáng

131

332996

1698

có được giọng nói rõ ràng

05:46

as our surrogatethay thế talkertalker --

132

334694

1754

như chính giọng
của người nói --

05:48

that's the personngười we borrowedvay mượn the filterlọc from—

133

336448

2595

người mà ta đã mượn bộ lọc--

05:51

and is similargiống in identitydanh tính to our targetMục tiêu talkertalker.

134

339043

4649

đồng thời có đặc điểm tương tự
với âm nguồn của người nói mục tiêu.

05:55

It's that simpleđơn giản.

135

343692

1427

Đơn giản thế thôi.

05:57

That's the sciencekhoa học behindphía sau what we're doing.

136

345119

2934

Đó là cơ sở khoa học
của việc chúng tôi đang làm.

06:00

So onceMột lần you have that in mindlí trí,

137

348053

3533

Vì thế, một khi bạn hỏi,

06:03

how do you go about buildingTòa nhà this voicetiếng nói?

138

351586

2258

làm thế nào
tạo ra giọng cho người này?

06:05

Well, you have to find someonengười nào

139

353844

1480

Bạn phải tìm ra ai đó

06:07

who is willingsẵn lòng to be a surrogatethay thế.

140

355324

2400

sẵn lòng là người thay thế.

06:09

It's not suchnhư là an ominousxấu xa thing.

141

357724

2264

Đó không phải là
một điều quá khó.

06:11

BeingĐang a surrogatethay thế donornhà tài trợ

142

359988

1523

Để là người
tặng giọng

06:13

only requiresđòi hỏi you to say a fewvài hundredhàng trăm

143

361511

2788

điều bạn cần làm
là nói vài trăm

06:16

to a fewvài thousandnghìn utteranceslời.

144

364299

2242

đến vài ngàn lời.

06:18

The processquá trình goesđi something like this.

145

366541

2003

Quá trình đó diễn ra
đại loại như.

06:20

(VideoVideo) VoiceGiọng nói: Things happenxảy ra in pairscặp.

146

368544

2190

(Video) Giọng nói:
Những thứ xảy ra cùng lúc.

06:22

I love to sleepngủ.

147

370734

1925

Tôi muốn đi ngủ.

06:24

The skybầu trời is bluemàu xanh da trời withoutkhông có cloudsđám mây.

148

372659

3882

Bầu trời xanh không gợn chút mây.

06:28

RPRP: Now she's going to go on like this

149

376541

2002

Rupal Patel: Cô ấy sẽ tiếp tục như thế

06:30

for about threesố ba to fourbốn hoursgiờ,

150

378543

1919

trong khoảng 3 đến 4 giờ,

06:32

and the ideaý kiến is not for her to say everything

151

380462

3005

vấn đề không phải là
cô ấy phải nói mọi thứ

06:35

that the targetMục tiêu is going to want to say,

152

383467

2045

mà người mục tiêu
sẽ nói trong tương lai,

06:37

but the ideaý kiến is to coverche all the differentkhác nhau combinationskết hợp

153

385512

3395

vấn đề ở đây là tạo ra tất cả
những kết hợp âm

06:40

of the soundsâm thanh that occurxảy ra in the languagengôn ngữ.

154

388907

3271

có thể có trong ngôn ngữ.

06:44

The more speechphát biểu you have,

155

392178

1638

Càng nhiều lời nói
được tập hợp,

06:45

the better soundingnghe voicetiếng nói you're going to have.

156

393816

2305

giọng được tổng hợp
càng có âm điệu tốt hơn.

06:48

OnceMột lần you have those recordingsđoạn ghi âm,

157

396121

1673

Khi đã có
những bản ghi âm thế này,

06:49

what we need to do

158

397794

1413

điều tiếp theo là

06:51

is we have to parsephân tích cú pháp these recordingsđoạn ghi âm

159

399207

2718

tách chúng

06:53

into little snippetsđoạn trích of speechphát biểu,

160

401925

2449

thành những đoạn nhỏ,

06:56

one-một- or two-sound2-âm thanh combinationskết hợp,

161

404374

2337

từ một đến hai âm kết hợp,

06:58

sometimesđôi khi even wholetoàn thể wordstừ ngữ

162

406711

1883

thậm chí là
toàn bộ từ

07:00

that startkhởi đầu populatingPopulating a datasetsố liệu or a databasecơ sở dữ liệu.

163

408594

4516

và tạo thành một bộ dữ liệu.

07:05

We're going to call this databasecơ sở dữ liệu a voicetiếng nói bankngân hàng.

164

413110

3717

Chúng tôi gọi bộ dữ liệu này
là ngân hàng giọng nói.

07:08

Now the powerquyền lực of the voicetiếng nói bankngân hàng

165

416827

2096

Bạn có thể thấy sức mạnh
của ngân hàng giọng nói

07:10

is that from this voicetiếng nói bankngân hàng,

166

418923

2014

07:12

we can now say any newMới utterancecâu phát biểu,

167

420937

2011

chúng ta có thể nói
bất cứ câu nào,

07:14

like, "I love chocolatesô cô la" --

168

422948

1424

như: "Tôi thích Sô cô la" --

07:16

everyonetất cả mọi người needsnhu cầu to be ablecó thể to say that—

169

424372

1739

mọi người đều cần phải nói thế--

07:18

fishcá throughxuyên qua that databasecơ sở dữ liệu

170

426111

1831

chỉ cần tìm trong bộ dữ liệu

07:19

and find all the segmentsphân đoạn necessarycần thiết

171

427942

1940

để có tất cả
những phân đoạn cần thiết

07:21

to say that utterancecâu phát biểu.

172

429882

1929

để nói ra điều này.

(Video) Giọng nói:
Tôi thích Sô Cô La.

07:23

(VideoVideo) VoiceGiọng nói: I love chocolatesô cô la.

173

431811

1789

07:25

RPRP: So that's speechphát biểu synthesistổng hợp.

174

433600

1391

RP: Đó là lời nói nhân tạo

07:26

It's calledgọi là concatenativeconcatenative synthesistổng hợp,
and that's what we're usingsử dụng.

175

434991

2573

được gọi là tổng hợp tập kết,
cái chúng tôi đang dùng.

07:29

That's not the novelcuốn tiểu thuyết partphần.

176

437564

1533

Không có gì mới mẻ.

07:31

What's novelcuốn tiểu thuyết is how we make it soundâm thanh

177

439097

2221

Điều lạ là cách ta tạo ra âm điệu
giống như người phụ nữ trẻ này.

07:33

like this youngtrẻ womanđàn bà.

178

441318

1457

07:34

This is SamanthaSamantha.

179

442775

1524

Đây là Samantha.

07:36

I metgặp her when she was ninechín,

180

444299

2346

Tôi đã gặp cô lần đầu
khi cô ấy 9 tuổi,

07:38

and sincekể từ then, my teamđội and I

181

446645

1897

và kể từ đó,
nhóm của tôi

07:40

have been tryingcố gắng to buildxây dựng her a personalizedcá nhân hoá voicetiếng nói.

182

448542

2714

đã cố gắng tạo ra
giọng nói riêng cho cô ấy.

07:43

We first had to find a surrogatethay thế donornhà tài trợ,

183

451256

3099

Đầu tiên, chúng tôi phải tìm ra
người hiến giọng nói,

07:46

and then we had to have SamanthaSamantha

184

454355

1818

và sau đó, để Samantha

07:48

producesản xuất some utteranceslời.

185

456173

1929

tạo ra vài câu nói,

07:50

What she can producesản xuất are mostlychủ yếu vowel-likegiống như nguyên âm soundsâm thanh,

186

458102

2379

hầu như
chỉ là những nguyên âm,

07:52

but that's enoughđủ for us to extracttrích xuất

187

460481

2479

nhưng như vậy là đã đủ
để trích xuất

07:54

her sourcenguồn characteristicsđặc điểm.

188

462960

2285

âm nguồn riêng của cô.

07:57

What happensxảy ra nextkế tiếp is besttốt describedmô tả

189

465245

3271

Để diễn đạt một cách tốt nhất
những gì xảy ra tiếp theo

08:00

by my daughter'scon gái analogysự giống nhau. She's sixsáu.

190

468516

2767

cần phải dùng lời của con gái tôi.
Nó lên 6 tuổi.

08:03

She callscuộc gọi it mixingpha trộn colorsmàu sắc to paintSơn voicestiếng nói.

191

471283

5422

Nó gọi đó là
trộn màu để vẽ nên giọng nói.

08:08

It's beautifulđẹp. It's exactlychính xác that.

192

476705

2555

Miêu tả tài tình.
Chính xác là vậy.

08:11

Samantha'sCủa Samantha voicetiếng nói is like a concentratedtập trung samplemẫu vật

193

479260

2860

Giọng nói của Samantha
giống như mẫu cô đặc

08:14

of redđỏ foodmón ăn dyethuốc nhuộm whichmà we can infuseinfuse

194

482120

2609

của màu đỏ thực phẩm
ta dùng

08:16

into the recordingsđoạn ghi âm of her surrogatethay thế

195

484729

2540

để tô vào bản ghi âm
giọng nói thay thế

08:19

to get a pinkHồng voicetiếng nói just like this.

196

487269

4387

tạo ra chất giọng màu hồng
như thế này.

08:23

(VideoVideo) SamanthaSamantha: AaaaaahAaaaaah.

197

491656

4491

(Video) Samantha: Aaaaaah.

08:28

RPRP: So now, SamanthaSamantha can say this.

198

496147

2808

Và bây giờ, Samantha
có thể nói như thế này.

08:30

(VideoVideo) SamanthaSamantha: This voicetiếng nói is only for me.

199

498955

3069

(Video) Samantha:
Giọng nói này chỉ dành cho tôi.

08:34

I can't wait to use my newMới voicetiếng nói with my friendsbạn bè.

200

502024

6305

Tôi nóng lòng muốn dùng nó
để nói chuyện với các bạn.

08:40

RPRP: Thank you. (ApplauseVỗ tay)

201

508329

6417

RP: Cảm ơn (Tiếng vỗ tay)

08:46

I'll never forgetquên the gentledịu dàng smilenụ cười

202

514746

2333

Tôi không bao giờ quên được
nụ cười dịu dàng

08:49

that spreadLan tràn acrossbăng qua her faceđối mặt

203

517079

1902

tỏa ra trên khuôn mặt
của Samantha

08:50

when she heardnghe that voicetiếng nói for the first time.

204

518981

3649

khi cô nghe giọng nói của mình
lần đầu tiên.

08:54

Now there's millionshàng triệu of people

205

522630

1882

Hiện nay, có hàng triệu người

08:56

around the worldthế giới like SamanthaSamantha, millionshàng triệu,

206

524512

2833

khắp thế giới như Samantha,
vâng hàng triệu,

08:59

and we'vechúng tôi đã only begunbắt đầu to scratchvết trầy the surfacebề mặt.

207

527345

3440

và chúng tôi chỉ mới bắt đầu
hỗ trợ được phần nổi.

09:02

What we'vechúng tôi đã donelàm xong so farxa is we have

208

530785

1642

Cho tới lúc này

09:04

a fewvài surrogatethay thế talkerstalkers from around the U.S.

209

532427

3859

có một vài người hiến giọng
trên khắp nước Mỹ.

09:08

who have donatedquyên góp theirhọ voicestiếng nói,

210

536286

1507

Chúng tôi đang sử dụng
những giọng nói này

09:09

and we have been usingsử dụng those

211

537793

1928

09:11

to buildxây dựng our first fewvài personalizedcá nhân hoá voicestiếng nói.

212

539721

4472

để xây dựng
những giọng nói cá nhân.

09:16

But there's so much more work to be donelàm xong.

213

544193

1756

Nhưng vẫn còn rất nhiều
việc phải làm khác .

09:17

For SamanthaSamantha, her surrogatethay thế

214

545949

2188

Với Samantha,
người hiến giọng cho cô ấy

09:20

cameđã đến from somewheremột vài nơi in the MidwestMidwest, a strangerlạ

215

548137

3046

đến từ Trung Tây,
một người lạ

09:23

who gaveđưa ra her the giftquà tặng of voicetiếng nói.

216

551183

3841

đã trao cho cô
món quà quý giá là giọng nói.

09:27

And as a scientistnhà khoa học, I'm so excitedbị kích thích

217

555024

2153

Là nhà khoa học,
tôi háo hức

09:29

to take this work out of the laboratoryphòng thí nghiệm

218

557177

1935

đưa dự án này
ra khỏi phòng thí nghiệm

09:31

and finallycuối cùng into the realthực worldthế giới

219

559112

1800

đến với đời thực

09:32

so it can have real-worldthế giới thực impactva chạm.

220

560912

3165

để nó có được
những tác động thực.

Tôi muốn chia sẻ
với các bạn tiếp theo

09:36

What I want to sharechia sẻ with you nextkế tiếp

221

564077

1582

09:37

is how I envisionhình dung takinglấy this work

222

565659

2175

đó là tôi
đã hình dung đưa dự án này

09:39

to that nextkế tiếp levelcấp độ.

223

567834

2711

lên một tầm cao hơn
như thế nào.

09:42

I imaginetưởng tượng a wholetoàn thể worldthế giới of surrogatethay thế donorsCác nhà tài trợ

224

570545

3887

Tôi tưởng tượng ra một thế giới
gồm những người hiến tặng giọng nói

09:46

from all walksđi bộ of life, differentkhác nhau sizeskích thước, differentkhác nhau ageslứa tuổi,

225

574432

3260

từ mọi hoàn cảnh,
mọi tầm vóc, mọi tuỏi tác,

09:49

comingđang đến togethercùng với nhau in this voicetiếng nói drivelái xe

226

577692

3058

đến với nhau
vì mục đích chung

09:52

to give people voicestiếng nói

227

580750

2270

trao tặng giọng nói cho con người

09:55

that are as colorfulĐầy màu sắc as theirhọ personalitiesnhân cách.

228

583020

3799

để cho giọng nói của họ cũng có sắc màu
như chính tính cách của họ vậy.

09:58

To do that as a first stepbậc thang,

229

586819

2300

Để thực hiện điều này
bước đầu tiên,

10:01

we'vechúng tôi đã put togethercùng với nhau this websitetrang mạng, VocaliDVocaliD.orgtổ chức,

230

589119

3275

chúng tôi cùng tạo
một website, VocaliD.org,

10:04

as a way to bringmang đến togethercùng với nhau those

231

592394

1624

như là một cách tập hợp

10:06

who want to jointham gia us as voicetiếng nói donorsCác nhà tài trợ,

232

594018

2675

những người mong muốn
hiến tặng giọng nói,

10:08

as expertisechuyên môn donorsCác nhà tài trợ,

233

596693

1772

cũng như
kiến thức chuyên môn,

10:10

in whateverbất cứ điều gì way to make this visiontầm nhìn a realitythực tế.

234

598465

5339

hoặc bất kỳ cách nào để đưa
dự án trở thành hiện thực.

10:15

They say that givingtặng bloodmáu can savetiết kiệm livescuộc sống.

235

603804

4153

Có người đã nói
hiến máu có thể cứu người.

10:19

Well, givingtặng your voicetiếng nói can changethay đổi livescuộc sống.

236

607957

4982

Và bây giờ, trao tặng giọng nói
cũng sẽ làm thay đổi cuộc đời.

10:24

All we need is a fewvài hoursgiờ of speechphát biểu

237

612939

3050

Tất cả những gì ta cần
là vài giờ nói chuyện

10:27

from our surrogatethay thế talkertalker,

238

615989

1491

từ những người hiến giọng,

10:29

and as little as a vowelnguyên âm from our targetMục tiêu talkertalker,

239

617480

4733

cũng như chỉ với vài nguyên âm
từ người cần giọng nói,

10:34

to createtạo nên a uniqueđộc nhất vocalgiọng hát identitydanh tính.

240

622213

3711

chúng ta có thể tạo ra
giọng nói cá nhân độc đáo.

10:37

So that's the sciencekhoa học behindphía sau what we're doing.

241

625924

2626

Đó là cơ sở khoa học
của việc chúng tôi đang làm.

10:40

I want to endkết thúc by circlingQuanh back to the humanNhân loại sidebên

242

628550

4455

Tôi muốn kết thúc bằng việc trở lại
nói về khía cạnh con người

10:45

that is really the inspirationcảm hứng for this work.

243

633005

4102

cảm hứng đưa chúng tôi
đến với dự án này.

10:49

About fivesố năm yearsnăm agotrước, we builtđược xây dựng our very first voicetiếng nói

244

637107

3699

Cách đây 5 năm, khi
xây dựng giọng nói đầu tiên

10:52

for a little boycon trai namedđặt tên WilliamWilliam.

245

640806

2501

cho một cậu bé tên là William.

10:55

When his mommẹ first heardnghe this voicetiếng nói,

246

643307

2357

Lần đầu tiên nghe được
giọng nói của con mình,

10:57

she said, "This is what WilliamWilliam

247

645664

2345

mẹ cậu ấy bảo,

11:00

would have soundednghe like

248

648009

1546

"Đây chính là giọng William

11:01

had he been ablecó thể to speaknói."

249

649555

2449

nếu như nó có thể nói."

11:04

And then I saw WilliamWilliam typingđánh máy a messagethông điệp

250

652004

2418

Và sau đó, tôi thấy William

11:06

on his devicethiết bị.

251

654422

1362

viết tin nhắn trên máy.

11:07

I wonderedtự hỏi, what was he thinkingSuy nghĩ?

252

655784

3293

Tôi tự hỏi, cậu ấy đang nghĩ gì?

11:11

ImagineHãy tưởng tượng carryingchở around someonengười nào else'scủa người khác voicetiếng nói

253

659077

3590

Hãy tưởng tượng mà xem,
ta mang giọng nói của một ai đó

11:14

for ninechín yearsnăm

254

662667

2193

trong 9 năm ròng

11:16

and finallycuối cùng findingPhát hiện your ownsở hữu voicetiếng nói.

255

664860

4844

và cuối cùng, tìm thấy
giọng nói của chính mình.

11:21

ImagineHãy tưởng tượng that.

256

669704

1377

Tưởng tượng thử xem.

11:23

This is what WilliamWilliam said:

257

671081

2797

Đây là điều William đã nói:

11:25

"Never heardnghe me before."

258

673878

4463

"Trước đây, chưa bao giờ
tôi nghe thấy tiếng mình."

11:32

Thank you.

259

680417

1619

Xin cảm ơn.

11:34

(ApplauseVỗ tay)

260

682036

4724

(Tiếng vỗ tay).

Translated by Nam Nguyen Cong
Reviewed by Nhu PHAM

ABOUT THE SPEAKER

Rupal Patel - Speech scientist
People relying on synthetic speech use the voice they’re given, not their own. Rupal Patel created the vocaliD project to change that.

Why you should listen

Northeastern University computer science professor Rupal Patel looks for ways to give voice to the voiceless. As founder and director of the Communication Analysis and Design Laboratory (CadLab), she developed a technology that combines real human voices with the characteristics of individual speech patterns. The result is VocaliD, an innovation that gives people who can't speak the ability to communicate in a voice all their own.

"There's nothing better than seeing the person who's actually going to use it, seeing their reaction, seeing their smile," says Patel.

More profile about the speaker
Rupal Patel | Speaker | TED.com

THE ORIGINAL VIDEO ON TED.COM

Rupal Patel: Giọng nói cũng độc đáo như vân tay | TED Talk | TED.com