Machine Learning & Linear Algebra

Ayman Hamed

عالم الذكاء الاصطناعي AI World

Machine Learning & Linear Algebra

عالم الذكاء الاصطناعي AI World

اشتركوا في القناة

Subscribe to the channel.

المتخصين وغير المتخصين ويمكن تكون نقطة تحاول في تفكيرنا أو في نظرتنا للراضيات عموما

Specialists and non-specialists can be a point to try in our thinking or in our perspective on sports in general.

أولا مش عايز المستمع يحس إن الحلقة دي متخصصة زيادة خصوصا لو بيحبش الراضيات وما يكملش

First, I don't want the listener to feel that this episode is too specialized, especially if they don't like math, so they don't continue.

وقبل ما ابتدي الحلقة عايز أقولكم إني رجعت بعض الكتب وفيديوهات على اليوتيوب

"Before I start the episode, I want to tell you that I reviewed some books and videos on YouTube."

أتمنى إن كل المعلومة فيها تفيدكم وأي ملحوظة أو تصحيح ياريت تكتبوه في التعليقات على أبليكيشن سبوتيفاي

I hope all the information is helpful to you, and if you have any notes or corrections, please write them in the comments on the Spotify application.

مش هنقول بقى همية الجبر الخطي linear algebra في المجالات دي؟

Aren't we going to talk about the importance of linear algebra in these fields?

الصح إن أنا نقول من وجهة نظري إن مجال تعلم الآلة والتعلم العميق والlarge language model of technology

In my opinion, the field of machine learning, deep learning, and large language model technology

أصلا مبني على الجبر الخطي ومن غير الجبر الخطي ما كناش سمان عن أي تطور في الزكاية الاصطناعية

It is originally based on linear algebra, and without linear algebra, we wouldn't have advanced in artificial intelligence.

طب نعرف بس إيه هو علم الجبر الخطي وإيه أهم حاجة بتميزه؟

Let's just understand what linear algebra is and what distinguishes it the most?

علم الجبر الخطي مبني أساسا على دراسة المتجهات vectors والمصوفات matrices

Linear algebra is primarily based on the study of vectors and matrices.

وقواعد التعامل معاها زي الجمع والضرب والتحويلات الخطية

And the rules for dealing with it are like addition, multiplication, and linear transformations.

اللي هي linear transformations

which are linear transformations

والمتجهة الهندسية geometric vector عبارة عن قيمة magnitude واتجاه direction

A geometric vector is a value of magnitude and direction.

يعني مثلا عندي متجه قيمته 5 وفي اتجاه x direction

For example, I have a vector with a value of 5 in the x direction.

وفيه قواعد بتميز المتجه وأهمهم إن أنا ممكن نجمع المتجهات وكمان ممكن نعمل لهم scale

In it, there are rules that distinguish vectors, and the most important of these is that I can add vectors and also scale them.

يعني لو متجه magnitude بتاعه 5 لو ضربته في scale 2 يبقى 5 في 2 بيساوي 10 ويكون في نفس الاتجاه

It means if you have a magnitude of 5 and you multiply it by a scale of 2, then 5 times 2 equals 10 and it will be in the same direction.

من وجهة نظر الكمبيوتر science الvector عبارة عن لستة من الأرقام

From the perspective of computer science, a vector is a list of numbers.

كل رقم فيهم بيمثل قيمة نقطة في الفضاء أو space

Each number represents a point value in space.

يعني لو عندي متجه عبارة عن نقطتين في اللستة 5 و3 مثلا

It means, if I have a vector that consists of two points, for example, 5 and 3 in the list.

يبقى بمشي 5 خطوات في اتجاه x ونطلع 3 خطوات في اتجاه y

I will walk 5 steps in the direction of x and then take 3 steps in the direction of y.

يبقى كده وصلنا لنقطة اللي بتمثل نهاية الvector

We have reached the point that represents the end of the vector.

ابتداء من نقطة صفر والمتجه ده بيكون 2D

Starting from point zero, and this vector is 2D.

2 dimensions

2 أبعاد

اللي أنا مشينا على محورين بس عشان نجيب نهايته

We only followed two paths to reach its conclusion.

ولو الvector بقى 3 نقط يبقى نقدر نشوفه وكأنه في فضاء سلاسي الأبعاد 3 dimensions

If the vector has 3 points, we can see it as if it is in three-dimensional space.

ولو 4 نقط يبقى ربعي الأبعاد وهكذا

If there are 4 points, then it will be a quarter of the dimensions, and so on.

بنستخدم بقى الvector في ايه؟ وإيه اللقطه بmachine learning والdata science كمان؟

What do we use vectors for? And what’s their role in machine learning and data science as well?

أول استخدامات الvector بستخدمه في data representation يعني تمثيل بيانات

The first uses of vectors are in data representation.

انتوا عارفين طبعا ان الكمبيوتر مش بيفهم إلا الأرقام

You all know, of course, that computers only understand numbers.

وعشان كده كل بيانات اللي بدخلها الكمبيوتر بيحولها لأرقام يقدر يخزنها وتعامل معها

That's why all the data I enter into the computer is converted into numbers that it can store and process.

تصور مثلا ان عندك بيانات للعقارات الموجودة في سكندرية وعايز تتعامل مع البيانات دي

Imagine, for example, that you have data on properties in Alexandria and you want to work with this data.

بنقول مثلا كل عقار لهم وصفات attributes

For example, we say that each property has attributes.

عدد القوض 3 عدد الحمامات 2 عدد الصلاة 1 المساحة 100 متر مربع وموصفات تانية كتير

Number of rooms: 3, number of bathrooms: 2, number of prayer rooms: 1, area: 100 square meters, and many other specifications.

البيانات دي بقى عشان نكتبها لعقار واحد بنحطها في lista يعني vector

This data is then put into a list, that is, a vector, in order to write it for a single property.

والجميل بقى انك لما بتدخل مليون عقار يعني مليون vector واخترت عقار منهم

And the beautiful thing is that when you enter a million properties, meaning a million vectors, and you choose one of the properties.

وعايز تشوف مثلا أقرب 10 عقارات للعقار ده

And you want to see, for example, the nearest 10 properties to this property.

من حيث الموصفات بتحسب حاجة اسمها vector similarity

In terms of specifications, a thing called vector similarity is calculated.

بين العقار ده وباقي العقارات

Between this property and the other properties.

وأعلى 10 أرقام تظهر لك في التشابه اللي هو similarity

And the top 10 numbers that appear to you in similarity.

يبقى أكتر شوة أو فيلل أو عقارات متشابهة مع العقار اللي انت اخترته

There are more villas or properties similar to the property you chose.

والvector similarity ده بقى حاجة تحفة

And this vector similarity is something amazing.

عارف لما تدخل على أمازون وتختار منتج وليكن شاشة كومبيوتر

When you enter Amazon and choose a product, let's say a computer screen.

تلاقي أمازون بيرشح لك شاشات قريبة كمان من الشاشة دي

Amazon also recommends screens that are close to this one.

وده ممكن يكون عن طريق vector similarity

"This could be done through vector similarity."

يعني

It means.

بيستخدموه في مجال recommendation systems

They use it in the field of recommendation systems.

ودي فايدة عظيمة من فايدة التعامل مع البيانات كvectors

There is a great benefit from dealing with data as vectors.

ومن العمليات المهمة جدا اننا ممكن نحاول الكلمات لvectors

One of the very important processes is that we can convert words into vectors.

يعبر عن معنى الكلمة

It expresses the meaning of the word.

يعني مثلا فراولة

It means, for example, strawberry.

دي كلمة بتعبر عن فاكهة لون أحمر صغيرة رخيصة مثلا

This is a word that refers to a small, cheap fruit that is red in color, for example.

فرأى عملت جدول للفواكه والخضروات

He saw that I made a schedule for fruits and vegetables.

وأحط علامة صح لكل فاكهة حسب هي ايه من حيث اللون

And I mark a check for each fruit according to its color.

وفاكهة ولا خضار وغالية ولا رخيصة

And fruit or vegetables, expensive or cheap.

علامات الصح دي بنحاولها في الآخر لأرقام

We try to convert the correct signs into numbers in the end.

يعني مثلا لو الأحمر كلون بديله رقم اتنين

It means, for example, if red as a color has a replacement number two.

فاكهة ولا خضار بديه فاكهة واحد وخضار اتنين وهكذا

Fruit or vegetable, for example, one fruit and two vegetables, and so on.

احنا كده كأننا بنعمل vector لكل فاكهة منهم

We are effectively creating a vector for each of those fruits.

والvector ده هو تمثيل بسيط لحاجة عظيمة اسمها

And this vector is a simple representation of something great called.

الvector embeddings

Vector embeddings

وهو انك بتحول المعلومة لأرقام بتمثلها

You are converting the information into numbers that represent it.

وممكن بقى بالطريقة دي تقوله عايز اقرب خضار للبقدونس

And you can then tell him, "I want the closest vegetable to parsley."

ويطلع مثلا الكزبرة

And for example, coriander grows.

واللي كتير مننا وانا منهم مش بيعرف يفرق بين الاتنين

Many of us, including myself, can't differentiate between the two.

ودي الفكرة اللي تبنى عليها حاجة اسمها

I like the idea that something called is built upon.

الword2vec

Word2Vec

اللي هو word2vector

which is word2vector

قدروا عن طريقها يحولوا ألاف الكلمات لvectors

They were able to convert thousands of words into vectors through it.

وكل vector بيمثل مواصفات الكلمة زي ما شرحنا في مثال الفواكه والخضروات

And each vector represents the characteristics of the word as we explained in the example of fruits and vegetables.

وطمعوا بعد كده وعملوا doc2vec

And then they got greedy and made doc2vec.

اللي هو document2vector

which is document2vector

يعني بيحولوا جمل مع بعضها

It means they combine sentences together.

او حتى ملف document لvector

or even a document file for vector

وهلوم مجرة

And so on.

تعالوا بقى في مجال large language models

Come on then, in the field of large language models.

لما بيحب يجيب بيانات من ملفات خارجية عن طريق rag

When he wants to retrieve data from external files via rag.

retrieval augmented generation

retrieval augmented generation

بيجيبها برضو عن طريق vector embeddings

He also gets it through vector embeddings.

كم انت عظيم ايها الفكتور

How great you are, Victor.

طيب بياننا سجل واحد للعقار

Okay, our statement is a single record for the property.

عمالي vector

My worker vector

اما البقى كل السجلات بتاعت العقارات عبارة عن ايه؟

What about the rest of the property records? What are they about?

بتكون عبارة عن مصفوفة

It will be in the form of a matrix.

ودي تاني اعظم حاجة في علم الجبر الخطي

I want the second greatest thing in linear algebra.

ونرجع تاني عشان ما نتوش

And we go back again so we don't get lost.

الفكتور ده بيكون one dimensional array

This vector becomes a one-dimensional array.

والمصفوفة ببساطة بتكون عبارة عن two dimensional array

And the matrix is simply a two-dimensional array.

يعني عبارة عن صفوف rows وعمدة columns

It means consisting of rows and columns.

زي ما بيحولوا

Just as they convert.

زي كده ما انت بتشتغل على اكسل

Like this, you work on Excel.

وبتدخل بيانات صف صف

And by entering data row by row.

وفي الاخر بتكون جدول

In the end, it becomes a schedule.

اهو الجدول ده بقى في علم البيانات بنسميه مصفوفة

This table is what we call a matrix in data science.

وكتير مننا ما يعرفش ايه هي فائدة المصفوفة الماتريكس

Many of us do not know what the benefit of the matrix array is.

وحسين انها ارقام وخلاص

And Hossain, these are just numbers, that's it.

تعالوا بقى نتعرف على سر خطير من اسرار الماتريكس واللي هي المصفوفة

Let's get to know a dangerous secret from the Matrix, which is the matrix itself.

الماتريكس دي في عالم الvectors

The matrix is in the world of vectors.

بتمثل التحول transformation للvector

It represents the transformation of the vector.

من حالة لحالة تانية

From one situation to another.

يعني مثلا لو عندك vector وعايز تعمله دوران rotation

For example, if you have a vector and you want to rotate it.

بتضرب matrix في الvector ده

You multiply the matrix by this vector.

والماتريكس دي بتمثل rotation

And this matrix represents rotation.

اللي بيحول vector لvector تاني بعد rotation

The one that transforms a vector into another vector after rotation.

يعني يا جماعة ببساطة لما تضرب matrix في vector

It means, guys, simply when you multiply a matrix by a vector.

انت بتحوله لvector تاني

You are converting it to another vector.

والماتريكس دي بتمثل التحول ده

And this matrix represents this transformation.

واللي هو transformation والناتج بيكون vector

And that is transformation, and the output will be a vector.

يا سلامة على عظمة

Oh, the greatness!

وممكن نضرب كمان matrix في matrix تانية

And we can also multiply one matrix by another matrix.

والناتج بيبقى matrix

And the output will be a matrix.

وده مثلا لما يكون عندك صورة رمضية

This is, for example, when you have a Ramadan-themed image.

gray image

صورة رمادية

واللي بيمثلها بمصفوفة ارقامها من 0 لغاية 255

And the one that represents it with an array of numbers from 0 to 255.

الصفر هنا بيمثل لون الاسود

The zero here represents the color black.

وال255 بتمثل لون الابيض

And 255 represents the color white.

واللي بينهم بقى بيكون درجات لون رمادي

And what lies between them becomes shades of gray.

تصور بقى انك عايز تلف الصورة دي 90 درجة

Imagine that you want to rotate this image 90 degrees.

انت كده بتعمل لها rotation

You are rotating it like that.

والبرنامج اللي بيلفها بيعمل لها transformation

And the program that wraps it performs a transformation on it.

يعني بيدرب فيها matrix تانية بخصائص معينة

It means it trains another matrix with specific properties.

تلف الصورة واللي هي المصفوفة بتاعتنا 90 درجة

Rotate the image, which is our matrix, 90 degrees.

او بتعمل لها حاجة اسمها transpose

Or you do something called transpose for it.

ودي من العمليات اللي بنعملها على الماتريكس

I want from the operations that we perform on the matrix.

تصور بقى كل حاجة انتبهها

Imagine now everything you perceive.

وكل حاجة انت بتعملها لما تشتعلها الصور بتتحول لماتريكس operations

And everything you do when you ignite it, the images turn into matrix operations.

يعني عمليات على المصفوفة واللي انت ظلمها من زمان ومش عايز تتعرف عليها

It means operations on the array that you have wronged for a long time and do not want to acknowledge.

وكل الimage processing مبني على عمليات حسابية على المصفوفة يمان

All image processing is based on mathematical operations on the matrix.

طب الصور الالوان بيبسلوها ازاي؟

How are the color photos developed?

بتكون عبارة عن 3 مصفوفات

It will consist of 3 matrices.

واحدة للون الاحمر والتانية للأخضر والتالتة للأزرق

One for red, one for green, and one for blue.

لو احنا شغالين RGB

If we are working with RGB.

Red, Green, Blue

Red, Green, Blue

ايه تاني ممتع في المصفوفات ممكن نقول للاصدقاء المستمعين؟

What else interesting about arrays can we tell our listening friends?

نتكلم على الماتريكس decomposition

Let's talk about matrix decomposition.

وده يا سيدي بيقولك ان كل مصفوفة ممكن نحولها لمصفوفتين او ثلاثة مضروبين في بعض

He is telling you, sir, that every matrix can be transformed into two or three matrices multiplied together.

ويه الميزة يعني؟

What does that mean?

الميزة اني ممكن امس المصفوفة كبيرة مثلا مليون صف في مليون عمود

The advantage is that I can handle a large array, for example, one million rows by one million columns.

بمصفوفتين اصغر بكتير

With two much smaller matrices.

بحيث يكون حاصل ضربهم هو المصفوفة الكبيرة دي

So that their product is this large matrix.

وده بيوفر كتير في التعامل مع الزاكرة memory

This greatly reduces the handling of memory.

وكمان بيسرع العمليات الحسابية جدا

It also speeds up calculations significantly.

بتكون كمان مفيدة لما يكون عندي ماتريكس مليانة اصفار

It will also be useful when I have a matrix full of zeros.

وطرق الماتريكس decomposition من اشهرها SVD

One of the most famous matrix decomposition methods is SVD.

موجودة في كورس لجوجل بتكلم عن مثال شركة نتفلكس

It's part of a course by Google that talks about the example of Netflix.

عندنا يوزرز مستخدمين وافلام موفيز

We have users and movies.

وعايزين نتوقع المستخدم لو شاف الفيلم الفلاني ممكن يديله تقييم قد ايه

And we want to predict how much rating the user might give if they watched that particular movie.

مش هنستفيد في الموضوع ده لكنه شيق جدا

We won't benefit from this topic, but it is very interesting.

تعالوا بقى نتكلم عن ازاي تطور الفيزيكية الاصطناعية كله مبني على اعمدة

Let's talk about how the development of artificial physics is based on pillars.

من اهمها الجبل الخطي linear algebra

One of the most important is linear algebra.

باختصار كده الneural network واللي مبني عليها علم deep learning

In short, the neural network, which is the foundation of deep learning science.

عبارة عن بيانات داخلة كvectors

Consists of input data as vectors.

وعملات حسابية جو الشبكة كلها عملات حسابية على الweights المصفوفات

And mathematical operations in the network are all mathematical operations on the weights of the matrices.

والinput اللي هي الvectors

And the input, which is the vectors.

وحتى تصميم transformers واللي هي اساس chgbt وgemini وكل الlarge language models

And even the design of transformers, which is the basis of ChatGPT, Gemini, and all large language models.

كلها حسابات vector embeddings للكلمات اللي داخلة

It's all about the vector embeddings calculations for the words inside.

ومصفوفات رايحة ومصفوفات جاية لغاية ما يطلع الكلام اللي انت بتشوفه مثلا وانت شغال مع chgbt

"And arrays coming and arrays going until the text that you see, for example, appears while you are working with chgbt."

احنا يا جماعة حاولنا نوضح بس

We, guys, tried to clarify, but...

اهمية علم الجبل الخطي linear algebra

The importance of linear algebra.

ولو انت مبرمج او شغال في مجال thought science او في مجال machine learning

If you are a programmer or working in the field of thought science or in the field of machine learning.

اتعرف اكتر عن العلم ده

Do you know more about this science?

وكل ما تعرف حاجة جديدة تشوف العلم ده بشكل مختلف

And every time you learn something new, you see that knowledge in a different way.

انصحكم بمتابعة قناة 3blue1brown

I advise you to follow the channel 3blue1brown.

ولو انت متخصص حتى هتنبهر بالمعنى الحقيقي للرياضيات

Even if you are a specialist, you will be amazed by the true meaning of mathematics.

لازم تشوفوها واللنك احطوه في الوصف

You have to see it and put the link in the description.

بيستخدموا كمان علم الجبل الخطي في موضوع مهم جدا اسمه dimensionality reduction

They also use the theory of linear algebra in a very important topic called dimensionality reduction.

والعلم ده بيقولك ان مش لازم كل الfeatures او المواصفات

And this knowledge tells you that not all features or specifications are necessary.

اللي في البيانات تكون على نفس القدر من الاهمية

What is in the data should be of equal importance.

فانا ممكن اعملك تخفيض reduction للfeatures دي

I can offer you a reduction on these features.

بحيث احاول اجيبلك اهم ما يمثل ال data

So I try to provide you with the most important aspects of the data.

وفي نفس الوقت اقل من البيانات اللي داخله

At the same time, it is less than the data inside.

ومن اشهر الطرق طريقة اسمها PCA

One of the most famous methods is called PCA.

principal component analysis

تحليل المكونات الرئيسية

ودي مبنية على المصفوفات والتعامل معاها

My friendship is built on arrays and dealing with them.

بيقولك باختصار كده ان المصفوفة اللي عندك واللي مليانة بيانات

He is telling you briefly that the array you have is filled with data.

ممكن اجيب لها حاجة اسمها eigenvectors

Can I get her something called eigenvectors?

وحاجة تانية اسمها eigenvalues

And there is another thing called eigenvalues.

والeigenvectors دي بقى المكونات الاساسية للمصفوفة

The eigenvectors are the basic components of the matrix.

principal components

المكونات الرئيسية

يعني مثلا انت ممكن تختار اول اتنين او ثلاثة principal components

For example, you can choose the first two or three principal components.

وتقرر ان دول اللي بيمثلوا المصفوفة بتاعتك

It was decided that the countries representing your matrix...

او البيانات بتاعتك حسب طبعا طبيعة كل مشكلة

Or your data depends on the nature of each problem.

كان نفسي انا اتكلم اكتر عن linear algebra

I wished I could talk more about linear algebra.

لكن ده بحر كبير قوي

But this is a very big sea.

وما تنسوش ان من اهم المكتبات اللي بتعامل مع algebra الخاطي عموما

And don't forget that one of the most important libraries that deals with errors in algebra in general.

مكتبة numpy وpyTorch وتensorflow

NumPy, PyTorch, and TensorFlow libraries.

قبل ما ننهي الحلقة

Before we finish the episode.

خلونا نناجع بسرعة اهم النقط اللي اتكلمنا عنها النهاردة

Let's quickly review the important points we discussed today.

اهمية algebra الخاطي في تعلم الالة

The importance of erroneous algebra in machine learning.

وضحنا ان algebra الخاطي وخاصة التعامل مع المتجهات والمصفوفات

We clarified that incorrect algebra, especially dealing with vectors and matrices.

هو الاساس اللي بنيت عليه معظم تقنيات تعلم الالة والتعلم العميق

It is the foundation on which most machine learning and deep learning techniques are built.

المتجهات

The vectors

شرحنا مفهوم المتجهات

We explained the concept of vectors.

وازاي بيمثل بيانات كأنها vectors

And how does it represent data as if it were vectors?

سواء كانت بيانات نصية او صور او حتى بيانات عقارات

Whether it's textual data, images, or even property data.

والكلامنا كمان عن مصفوفات matrices وdimensionality reduction تقليل الابعاد

We also talked about matrices and dimensionality reduction.

وكمان الvector embeddings

And also the vector embeddings.

خلاصة الخلاصة

The summary of the summary.

algebra الخاطي وتقنيات زي المتجهات والمصفوفات

bogus algebra and techniques like vectors and matrices

بيمثلوا العمود الفقري لتعلم الالة والذكاء الاصطناعي

They represent the backbone of machine learning and artificial intelligence.

مهما كانت خلفيتك في راضيات

No matter what your background is in mathematics.

معرفتك بالمفاهيم دي حتفتحلك افاق جديدة في فهم وتحليل بيانات

Your understanding of these concepts will open new horizons for you in understanding and analyzing data.

اتمنى الحلقة تكون عجبتكم

I hope you liked the episode.

ما تنسوش تدوا تقييم الحلقة والبودكاست عموما

Don't forget to rate the episode and the podcast in general.

وما تنسوش تكتبوا رأيكم وملاحظاتكم في الحلقة

And don't forget to write your opinions and notes about the episode.

وافكاركم من الحلقات الجاية

And your ideas for the upcoming episodes.

واركم بخير يا احلى متابعين

You are great, oh sweetest followers!

كان معكم ايمان حامد وسلمة ايمان حامد

You were with Iman Hamid and Salma Iman Hamid.

السلام عليكم ورحمة الله وبركاته

Peace be upon you and God's mercy and blessings.

Continue listening and achieve fluency faster with podcasts and the latest language learning research.