Abdulmajeed Profile
Abdulmajeed

@saudiYoda1

Followers
909
Following
759
Media
285
Statuses
1,633

علم البيانات | تعلم الآلة | الذكاء الاصطناعي (AI) | NLP & LLM #الذكاء_الاصطناعي | إثراء المحتوى العربي في #تعلم_الآلة

Riyadh
Joined September 2018
Don't wanna be here? Send us removal request.
Explore trending content on Musk Viewer
@saudiYoda1
Abdulmajeed
4 months
Technical question تخيل يجيك سؤال مثل هذا في المقابلة يبغاك تستخرج بيانات اليوزر بعد ٦٠ يوم من تسجيل اليوزر في الموقع عشان تعرف نشاطاته في اخر ٦٠ يوم وتحللها البيانات في json format
Tweet media one
2
17
254
@saudiYoda1
Abdulmajeed
3 months
في تحليل البيانات، استخدام طرق Bayesian يعتبر مهارة مهمة جداً. راح أشرح ليش هي مهمة وكيف يمكن استخدامها في الكود.
1
15
138
@saudiYoda1
Abdulmajeed
4 months
في المقابلات الشخصية انت تبي تطلع قدراتك كيف انك تقدر تبني وتظهر قدراتك في ML lifecycle من البداية حتى النهاية. في هذا الثريد شرحت لكم بعض النقاط بتساعدكم باذن الله في المقابلات
1
9
105
@saudiYoda1
Abdulmajeed
7 months
اليوم راح نتكلم عن ال backpropagation هو خوارزمية تستخدم في مرحلة التدريب في ال neural network كيف يعمل وش فكرته بالضبط ؟ خلو ناخذ مثال جملة اليوم الطقس جميل
Tweet media one
1
10
91
@saudiYoda1
Abdulmajeed
7 months
اختبار الفرضية: الـ hypothesis testing والـ p-value أساسيان في الإحصاء ويستخدمان لتحديد إذا كانت البيانات تحتوي على دليل كافٍ يشير إلى وجود فرق أو تأثير.
Tweet media one
1
11
78
@saudiYoda1
Abdulmajeed
4 months
فيه تطور خرافية في عالم النماذج اللغوية الكبيرة تم اصدار ورقة بحثية LLM4Decompile وللامانة اثارت اهتمامي كثير.
Tweet media one
1
5
49
@saudiYoda1
Abdulmajeed
6 months
ثريد🧵 بنتكلم اليوم عن RELU و Sigmoid. طبعًا، بالبداية لازم نعرف وناخذ فكرة عن الـ activation function لأن RELU و Sigmoid نوع من أنواع الـ activation function.
Tweet media one
2
6
38
@saudiYoda1
Abdulmajeed
1 month
اليوم بنتكلم عن Data Pipelines باختصار هي عملية تاخذ البيانات وتجمعها وتحولها وتحطها في Batch و stream processing عشان تعالجها في جداول محددة وفي وقت فعلي وهذا الشي يساعد عالم البيانات والمحللين من تحليل البيانات وتصورها على حسب الغرض
1
7
38
@saudiYoda1
Abdulmajeed
7 months
اليوم بنتكلم عن (Gaussian Mixture Model - GMM) وش يعني ومتى نستخدمه ؟ اول شي GMM هو unsupervised learning يستخدم في لما عندك بيانات كبيره ومعقدة وفيها أنماط غير واضحة
Tweet media one
3
7
34
@saudiYoda1
Abdulmajeed
3 months
فيه تقنيتين خورازميات كويسة وتساعد كثير في حالات عندك DFS و BFS DFS Deep first search وهذي التقنية تستخدم في البحث بالعمق ويتم تطبيقها عن طريق stack او recursion يعني خذ مثال: City A City B City C City E
2
8
36
@saudiYoda1
Abdulmajeed
5 months
ثريد 🧵 اليوم بتكلم عن ال Bayesian statistics وكيف مهم الاحصاء بشكل عام مهم جدا للتعامل مع البيانات وتحليلها خلو ناخذ مثال
1
2
34
@saudiYoda1
Abdulmajeed
7 months
في #التعلم _الآلة، نستخدم نماذج رياضية للتنبؤ. هذه النماذج تتعلم من البيانات. لكن أحيانًا، ممكن تتعلم النماذج “بشكل مفرط” وتبدأ في حفظ البيانات بدال من فهم patterns. نواجة مشكلة ال overfitting وهنا فيه تكنيك بيساعدنا نتفادى المشكله هذي الي هو Regularization
Tweet media one
2
3
29
@saudiYoda1
Abdulmajeed
5 months
ثريد 🧵 اليوم بنتكلم باختصار عن نموذج Transformer، باستخدام الجملة “أنا أحب الذكاء الاصطناعي” بطريقة بسيطة. مهم جدا فهم Transforner خصوصا مع تطور النماذج اللغوية الكبيره مثل Chatgpt وغيرها
Tweet media one
1
3
30
@saudiYoda1
Abdulmajeed
3 months
تقنية RAG وهي تعرف بـ”استرجاع وتوليد الإجابات” (Retrieval-Augmented Generation)، من التقنيات الهامة جدًا وابي طلب كبير حاليًا. هذه التقنية تساعد في استرجاع الإجابات من المستندات بناءً على الأسئلة المطروحة؛ يعني انك لما تطرح سؤال، تقوم بالبحث في المستندات لاستخلاص الجواب المناسب.
2
5
25
@saudiYoda1
Abdulmajeed
4 months
في عالم البيانات، يوجد ما يسمى بـ interpretation “تفسيرات الاحتمالات”، وهي مهمة في حالة استخدام الاحتمالات. عندنا: •Frequentist الاحتمال التكراري. •Bayesian النهج البيزي.
1
1
25
@saudiYoda1
Abdulmajeed
7 months
ما هو (PCA)؟ (PCA) هو طريقة لتبسيط البيانات المعقدة. تخيل أن عندك الكثير من البيانات، وهي معقدة جدًا وصعب فهمها دفعة واحدة. هنا يجي دور PCA في البحث عن أهم جزء من هذه البيانات.
2
3
26
@saudiYoda1
Abdulmajeed
7 months
سؤال يتكرر بالمقابلات الفرق بين Bagging and boosting ؟
1
1
25
@saudiYoda1
Abdulmajeed
6 months
ثريد 🧵 ال decoding وبمعنى فك الشفره في LLM مهم جدا يعني بعطيك مثال بسيط عشان تفهم اهميته تخيل الجملة القطه جلست على …
4
2
21
@saudiYoda1
Abdulmajeed
4 months
وش الفرق بين precision و recall ؟ وتستخدم اي وحده في تصنيف (classification )
1
0
19
@saudiYoda1
Abdulmajeed
20 days
وجد الباحثون أن XGBoost يتفوق على نماذج التعلم العميق في التعامل مع مجموعات البيانات الجدولية المتنوعة. كما تسلط الدراسة الضوء على قوة hybrid ensemble ، بالجمع بين XGBoost والتعلم العميق للحصول على أفضل النتائج. رابط الورقة البحثية:
2
2
18
@saudiYoda1
Abdulmajeed
7 months
لما يكون عندك مودل راح اكيد تحتاج تخليه يعمل بشكل أفضل لاحتياجاتك الخاصة. الان بنستعرض بعض الطرق باختصار : 1.اول شي (Quantization) يخلي المودل أسرع وأصغر : تخيل أن المودل حقك مثل حقيبة ظهر كبيرة مليانه بالكتب. الكمية هي مثل استبدال الكتب الثقيلة بنسخ مختصرة وأخف وزنًا.
1
0
18
@saudiYoda1
Abdulmajeed
4 months
كتاب مجاني جميل في التعلم العميق للتحميل كويس للمبتدىء وكذلك والي عندهم خبرة ايضا للتحميل:
0
0
17
@saudiYoda1
Abdulmajeed
2 months
الآن، إذا كنت عالم بيانات أو مهندس تعلم الآلة، ممكن تسأل نفسك: هل لازم أتعلم Kubernetes؟ هل هو جزء من مسئوليتي كعالم بيانات؟ وهل لازم أتعلم Docker؟
3
3
17
@saudiYoda1
Abdulmajeed
4 months
تقنية “two pointers” تعتبر تقنية مهمة في عالم تحليل البيانات وهي سؤال شائع في المقابلات الوظيفية، وفكرتها ببساطة تتمثل في عملية بحث فعالة داخل سلسلة أو مصفوفات لضمان عدم حدوث تصادم بين الزوجين أو النقطتين.
1
2
17
@saudiYoda1
Abdulmajeed
9 days
تطورت الشبكات العصبية بشكل ملحوظ مع مرور السنوات الان تدريب الشبكات العصبية صار افضل ماقبل ٢٠١٢، التطور صار على مرحلتين:
1
1
16
@saudiYoda1
Abdulmajeed
4 months
ورقة بحثية جديدة تناقش النماذج اللغوية الضخمة بوصفها مُحركات (compilers). طيب وش معنى الشي هذا؟ بيكون هناك إطار عمل اسمه “think and execute” وفقًا لما ورد في الورقة. لما تطرح سؤال، راح يقوم بإنشاء pseudocode وبعدين يتم تنفيذه (execute).
1
2
15
@saudiYoda1
Abdulmajeed
6 months
ثريد 🧵 اليوم بنتكلم عن Adversarial Validation تخيل ان عندك مودل وتبي تنشره وتسوي له deploy من اهم الاشياء الي لازم يتم تطبيقها وتعرف اذا المودل حقك بيصير كويس في ال production حلو إنك تطبق شي اسمه Adversarial Validation
2
1
16
@saudiYoda1
Abdulmajeed
7 months
الفرق بين +=و join في البايثون خلو نبدا في += المثال الي في صورة يسوي سلسلة نصية جديدة لتحتوي عل نتيجة ويستخدم += يضيف سلسلة نصية ثانية لكن هذي مشكلة لانه يستهلك ذاكرة في كل مرة. يعني الان لو عندك كلمات كثيرة وفي كل تكرار راح يتم إنشاء سلاسل نصية مؤقتة وهذا يستهلك ذاكرة
Tweet media one
1
0
15
@saudiYoda1
Abdulmajeed
7 months
يُعتبر الـ Gradient Descent من أفضل خوارزميات التحسين (optimization algorithms). تخيل أنك على تلة مغطاة بالضباب وأنت تنزل من التلة إلى الوادي أدناه. طبعاً في هذه الحالة، ماراح تنزل بشكل سريع لأن الضباب يحد من رؤيتك وقد تتعرض للسقوط والإصابة البليغة.
Tweet media one
3
3
15
@saudiYoda1
Abdulmajeed
6 months
في ورقة بحثية تتحدث عن دمج Reinforcement learning مع النماذج اللغوية الكبيرة (LLM). هذا الدمج راح يجعل الLLM أكثر تفاعلية بسبب أن Reinforcement learning (RL) يعلم النماذج كيفية اتخاذ القرارات بناءً على التجربة والخطأ والتعلم من التفاعلات لتحقيق أهداف معينة من خلال feedback.
1
2
14
@saudiYoda1
Abdulmajeed
7 months
من طرق عمل ال fine tune ل LLM طريقة تسمى Qlora لما تبني chatbot باستخدام LLM طبعا انت راح في احد المراحل تضطر تسوي لها fine tune وهنا بتساعدك كثير
2
0
14
@saudiYoda1
Abdulmajeed
3 months
تختلف طريقة تسليم الأكواد من علماء البيانات إلى مهندسي تشغيل الآلة التعليمية (ML Ops) بشكل كبير. المفترض والمعروف انه مايكون فيه تسليم بالاصل اذا الهدف هو التوسع والأتمتة لكن انك توصل إلى المستوى هذا ماهو بالسهل. الي يصير ثلاث حالات عشان توصل للطريقة المثالية:
1
2
13
@saudiYoda1
Abdulmajeed
3 months
الان في حالة feature engineer الاغلب يعرف انك لما تبني موديل راح تحتاج في احد الخطوات تسوي شي اسمه feature engineer وهو باختصار انك تصنع features جديدة او تستخدم features موجودة في البيانات عشان تحسن الموديل عندك وترفع من دقته
1
5
13
@saudiYoda1
Abdulmajeed
6 months
MixTral من النماذج الكبيرة الي حاليا تنافس GPT ومميز جدا والي يميزه استخدامه Flash attention و sliding window attention وهذي اعطت MixTral المزايا الي بنتكلم عنها الان
1
2
13
@saudiYoda1
Abdulmajeed
3 months
@passionategirlN صحيح والتركيز يكون على الاحصاء و probability جدا مهم لان مع تطور AI وجالس يكوش على كل شي لكن الاحصاء و probability راح تساعدك في فهم البيانات شي حتى الان ماوصل له AI وهذا راح يخليك المميز
0
2
11
@saudiYoda1
Abdulmajeed
3 months
فيه مكتبة جدا مفيده تقدر تستخدمها لو بتسوي genAi مشروع. الان نعرف فيه النماذج اللغوية الكبيره واغلبها اكون عباره عن تشات بوت تستخدم لما احاول تسوي تشات مع دوكمنت او غيرها من use cases
1
1
12
@saudiYoda1
Abdulmajeed
5 months
ثريد 🧵 فيه مكاتب في البايثون تعتبر standard library جاهزه للاستخدام مباشرة وميزة المكاتب هذي تغطي كثير من جوانب البرمجة المختلفة، من تلاعب بالملفات الى التعامل مع البيانات المعقدة من دون احتاج الى مكاتب خارجية.
1
0
12
@saudiYoda1
Abdulmajeed
3 months
في مؤتمر ليب، أُعلن عن افتتاح مركز بيانات جديد لأمازون في السعودية، وهذا خبر رائع جدًا. AWS SageMaker وهذا خبر ممتاز لان AWS safemaker يتميز باشياء كثيرة
1
1
12
@saudiYoda1
Abdulmajeed
6 months
ثريد 🧵 كيف تبني دردشة بوت باستخدام LLM؟ في هذا الثريد، سأتحدث عن الـ pipeline لكيفية بناء دردشة بوت.
2
2
12
@saudiYoda1
Abdulmajeed
5 months
ما هو ال SFT؟ Sparse Fine-Tuning (SFT) يتم استخدامه لرفع الأداء باستخدام أقل الموارد الحاسوبية ويعطي تنظيمًا دقيقًا.
2
0
12
@saudiYoda1
Abdulmajeed
4 months
هذا الكود كامل
Tweet media one
4
0
9
@saudiYoda1
Abdulmajeed
2 months
اليوم بنتكلم عن polynomial وهو يتم استخدامه لتحديد model complexity الي تكلمت عنها في الرابط تحت
@saudiYoda1
Abdulmajeed
8 months
ما معنى مصطلح "Model Complexity" في ال Machine learning ؟
Tweet media one
1
0
4
1
0
10
@saudiYoda1
Abdulmajeed
5 months
ثريد 🧵 اليوم بنتكلم عن Dimensionality reduction تقليل الابعاد انواعه ومتى استخدام كل نوع منه ومثال
1
0
10
@saudiYoda1
Abdulmajeed
3 months
ورقة بحثية تتكلم عن اداة AutoCrawler راح تساعد في جمع البيانات الويب المتنوعة والمتغيرة للنماذج اللغوية الكبيرة الي يميز AutoCrawler الاتمتة الي هي راح تستخدم منهجية من الأعلى الى الأسفل والعودة للخلف لصقل فهمه لمحتوى HTML وبالاضافة الى تصحيح الأخطاء من خلال الرجوع
Tweet media one
1
3
10
@saudiYoda1
Abdulmajeed
4 months
تقنية sliding window تقنية مهمة جدا في عالم البينات وتعطيك فرصة تعالج كتل بيانات مجموعات فرعية من مجموعات كبيرة من دون بدون تكرار غير ضروري.
1
0
9
@saudiYoda1
Abdulmajeed
4 months
لو في المقابلة الان انه يبغاك تسوي churn يعني تشوف اذا اليوزر ما سوا login اخر ثلاثين يوم. التحدي هنا كيف راح تستخدم بيانات اليوزر ونشاطاته من ثلاث جداول User signups User Logins User Information
@saudiYoda1
Abdulmajeed
4 months
Technical question تخيل يجيك سؤال مثل هذا في المقابلة يبغاك تستخرج بيانات اليوزر بعد ٦٠ يوم من تسجيل اليوزر في الموقع عشان تعرف نشاطاته في اخر ٦٠ يوم وتحللها البيانات في json format
Tweet media one
2
17
254
1
0
9
@saudiYoda1
Abdulmajeed
4 months
ورقة بحثية تشير البحوث إلى أن أحدث LLMs مابعد وصل إلى مستوى المهارة الي يظهره البشر في مهام البرمجة المتعلقة بالفيزياء. طبعا من خلال هندسة الطلاب اداء GPT-4 افضل من GPT-3
1
1
8
@saudiYoda1
Abdulmajeed
6 months
اليوم بنتكلم عن كيفية عمل البحث الدلالي (semantic search) والخطوات المتبعة فيه. هذه المعرفة مهمة جدًا، خاصة في زمن النماذج اللغوية الكبيرة (LLM) والدردشات الآلية (chatbots). من المهم أن يكون لكل الشخص فهم واضح لهذه العمليات.
1
1
8
@saudiYoda1
Abdulmajeed
3 months
@passionategirlN حرف E Ensemble: شرحتها هنا EDA: تحليل المبدئي Entropy: شرحتها هنا
@saudiYoda1
Abdulmajeed
7 months
واحدة من معادلات الاحتمالات (Probability) المستخدمة في تعلم الآلة (machine learning) تُعرف باسم الإنتروبيا (Entropy). فكرتها تقوم على تقييم النقاء (purity) وعدم النقاء (impurity).
Tweet media one
1
0
7
0
1
7
@saudiYoda1
Abdulmajeed
3 months
من مميزات AWS انه يوفر شي اسمه Elastic inference. فايدة Elastic inference انه يوفر المرونة ان يتيح لك العدد المناسب من GPU في الموديل حقك في amazon sagemaker
1
2
8
@saudiYoda1
Abdulmajeed
7 months
فيه نموذج جديد “Mixtral of Experts” نموذج ذكاء اصطناعي جديد يتميز بكفاءته وسرعته العالية مقارنة بالنماذج اللغوية الكبيرة الأخرى مثل GPT-3. يعتمد هذا النموذج على نهج Mixtral of Experts، بمعنى انه يستخدم أجزاء مختلفة من النموذج لمهام مختلفة.
2
1
8
@saudiYoda1
Abdulmajeed
5 months
ثريد 🧵 اليوم بتكلم عن انواع activation function ومتى تستخدم كل وحده منهم ؟
1
2
8
@saudiYoda1
Abdulmajeed
6 months
ثريد 🧵 في مجال الذكاء الاصطناعي، تعتبر عملية Embedding خطوة أساسية لفهم النصوص. هذي العملية تحول الكلمات إلى أرقام تخلي العملية اسهل على الكمبيوتر معالجتها. التحويل هذا يمكن النماذج من التعلم من النصوص وأداء مهام متعلقة باللغة. الآن بنتكلم عنها خطوة بخطوة وكيف تصير.
1
1
8
@saudiYoda1
Abdulmajeed
3 months
في xgboost فيه شي يسمى Gini coefficient هو قيمة تعلمك اذا بياناتك تتراوح الى فئة محددة او تنقسم وفيه توزيع حق اكثر من فئة وتصنيف
3
1
7
@saudiYoda1
Abdulmajeed
7 months
واحدة من معادلات الاحتمالات (Probability) المستخدمة في تعلم الآلة (machine learning) تُعرف باسم الإنتروبيا (Entropy). فكرتها تقوم على تقييم النقاء (purity) وعدم النقاء (impurity).
Tweet media one
1
0
7
@saudiYoda1
Abdulmajeed
6 months
ثريد عن self attention خلو ناخذ مثال الجملة هذي " قرأ الولد الكتاب في المكتبة " الي بيصير الان طبعا بعد خطوات tokenization وال embedding تكلمت عنها سابقا
1
0
7
@saudiYoda1
Abdulmajeed
7 months
ورقة بحثيه اصدرت قبل اسبوعين تتكلم عن الهلوسه وطرق جديده في كيفية تخفيف الهلوسة في ال LLM من الطرق الجديدة علي شخصيا في الورقة
1
0
6
@saudiYoda1
Abdulmajeed
8 months
الفرق بين One-Hot Encoding و Label Encoding اول شي راح نبدا مع One-Hot Encoding يحول كل مستوى تصنيفي إلى متغير ثنائي جديد (0 أو 1). متى يستخدم؟ . يستخدم لما يكون عندك في قيم تصنيفية مثل الألوان، أسماء المدن
1
1
5
@saudiYoda1
Abdulmajeed
2 months
@AbdullahAws99 فيه شي لازم يفهمونه الي يقولون برنامج تافه انت لازم تحدد البيانات الي تطلع في الداش بورد كيف تحلل وتحدد البيانات هذا ابداع بذاته
1
2
6
@saudiYoda1
Abdulmajeed
9 months
@CareAljawazat عندي سفره يوم الخميس وطلبت تجديد جواز عن الطريق النظام واليوم اتصلت قالو راح ياخذ سبع ايام عمل، هل ممكن تسريع العمليه ؟
7
0
4
@saudiYoda1
Abdulmajeed
5 months
LLM tokenizer مهم جدا ويساعد في تجنب مشاكل كثيره مثل الهلوسة وغيرها في المدونة هذي شرحتها بالتفصيل كيف تسوي tokenizer في النماذج اللغوية الكبيرة وباللغة العربية
0
0
6
@saudiYoda1
Abdulmajeed
3 months
@passionategirlN حلو ايضا ان يكون عنده خلفية بسيطه في data engineering عشان يبني data pipeline صاحي
0
0
5
@saudiYoda1
Abdulmajeed
3 months
اليوم بنتكلم عن positional embedding وتطوراته وكيف ساعد في التعامل context window مراحلة كالتالي Absolute → Relative → RoPE
1
4
5
@saudiYoda1
Abdulmajeed
6 months
فيه مشكلة في التعلم الالي اسمها data leakage وهذا الشي يصير لما الموديل يحصل على معلومات مفترض انه مايوصل لها خلال مرحلة التدريب يعني مثل بيانات الاختبار
1
0
6
@saudiYoda1
Abdulmajeed
3 months
@passionategirlN اخذت كثير كورسات لكن مافيه افضل انك تشتغل تطبيقي تحمل داتا وتشتغل عليها. لو فيه كورس فادني اشوف nano degrees يوداستي افضل شي
0
0
6
@saudiYoda1
Abdulmajeed
3 years
@HeadieOne17 @btsportufc Man Same thing, I saw the broken heart emoji and I was like what happened? He just weighted in
1
0
5
@saudiYoda1
Abdulmajeed
6 years
في عالم مارفال، سبايدرمان وديدبول في الكومك راحو السينما يتفرجون على فلم دي سي باتمان ضد سوبرمان وماعجبهم! #spidermanps4 #deadpool
Tweet media one
0
2
4
@saudiYoda1
Abdulmajeed
3 months
لا تحمل هم رزقك أو كيفية وصوله إليك، فقد أخبرنا الله سبحانه وتعالى بأن الرزق مقدر ومكتوب بيده، فقال تعالى: ﴿وَفِي السَّمَاءِ رِزْقُكُمْ وَمَا تُوعَدُونَ﴾، مما يعني أن كل ما هو خير لنا في الدنيا وما وُعدنا به في الآخرة محفوظ ومضمون بأمره.
1
1
5
@saudiYoda1
Abdulmajeed
4 months
جل اعلنت عن أداة Screen AI هذي الاداة ممكن تغير الطريقة الي يتم تصميم تجارب المستخدم UX بشكل كبير.
1
4
4
@saudiYoda1
Abdulmajeed
6 months
@passionategirlN جميل جدا ماشاءالله فيه xgboost و SVM احد الموديلز الي تتعامل مع النقط الشاذه الي يميز xgboost انه كويس جدا مع ال complex models
0
1
5
@saudiYoda1
Abdulmajeed
7 months
ماهو ال vanishing gradient و exploding gradient ؟ ناخذ كمثال جملة “الطقس جميل اليوم” لتوضيح مشكلة الـ “Vanishing Gradient”.
2
0
4
@saudiYoda1
Abdulmajeed
6 months
ثريد 🧵 انواع الـ Embeddings مع أمثلة:
1
1
5
@saudiYoda1
Abdulmajeed
6 months
شركة cohere نزلت موديل LLM جديد مفتوح المصدر يدعم اللغة العربية وكمان نشرت الداتا ست اللي تم تدريبة عليها مجانا لتجربة الموديل
0
0
4
@saudiYoda1
Abdulmajeed
3 years
مثال بسيط في الذكاء الاصطناعي في الأمن السيبراني ، يمكن للباحث استخدام NLP لبناء مضاد للفيروسات باستخدام HEX لاكتشاف العينات المتشابهه. على سبيل المثال ، يمكن يكون فيه نموذج A ثم يضيفون MD5 / SHA-256. طيب لو كان هناك تغيير في الملف أو نسخة أخرى؟
1
2
4
@saudiYoda1
Abdulmajeed
5 months
@Bushra_Sarhan هذي تستخدم في الاختراقات. وافضل طريقه انك تستخدم شي اسمه data sanitization
0
1
4
@saudiYoda1
Abdulmajeed
7 months
ال Class imbalance في #تعلم_الآلة تخيل أن عندك مجموعة من الأطفال في فصل دراسي ولازم تختار قائد للفصل. إذا اخترنا القائد فقط لأن أغلب الأطفال يحبون الألعاب الرياضية وهو يحبها أيضًا، احتمال نختار القائد الأفضل إذا كان هناك طفل آخر يحب العلوم ولديه مهارات قيادية جيدة.
Tweet media one
1
0
4
@saudiYoda1
Abdulmajeed
6 months
غرض التضمين (embedding): تمثل هذي التضمينات (embeddings) الكلمات بطريقة تسمح للنموذج (model) بمعالجتها، بحيث تلتقط معنى كل كلمة بشكل رقمي. يعني الكلمة تتحول الى vector بشكل رقمي عشان الكمبيوتر يفهمها
1
0
2
@saudiYoda1
Abdulmajeed
7 months
Bagging فكر في ال bagging كانك تقوم بإنشاء فريق بحيث تشوف كل عضو (model) إلى جزء مختلف من المشكلة (البيانات). كل عضو في الفريق يتخذ قراره الخاص، ثم يصوت الفريق عشان يوصل إلى قرار نهائي. طبعا يتم تدريب ال models بطريقه parallel processing بحيث كل model يتم تدريبه بشكل فردي
Tweet media one
1
0
4
@saudiYoda1
Abdulmajeed
12 days
تكلمت قبل عن Transformer في هذا الثريد
@saudiYoda1
Abdulmajeed
5 months
ثريد 🧵 اليوم بنتكلم باختصار عن نموذج Transformer، باستخدام الجملة “أنا أحب الذكاء الاصطناعي” بطريقة بسيطة. مهم جدا فهم Transforner خصوصا مع تطور النماذج اللغوية الكبيره مثل Chatgpt وغيرها
Tweet media one
1
3
30
1
1
4
@saudiYoda1
Abdulmajeed
7 months
لما تبني مشروع generative AI خل نقول مثال تبي تستخدم open source LLM وتبني chatbot غالبا ماراح تعاني من مشكلة ال hallucination وهي ان راح يعطيك جواب يختلف عن السؤال الي سالته. تحت احد افضل الطرق والابحاث لتخفيف مشكله الهلوسة:
2
2
4
@saudiYoda1
Abdulmajeed
8 months
ما معنى مصطلح "Model Complexity" في ال Machine learning ؟
Tweet media one
1
0
4
@saudiYoda1
Abdulmajeed
4 months
@_Bushra_AI اشوفه مايهدد لكن بيقلل من قيمة العمل الي اسوية يعني من زمان المبرمج كان راتبه عالي مع الاتمتة راح تقل قيمته
0
0
3
@saudiYoda1
Abdulmajeed
5 years
المشهد هذا يشرح علاقه قارب بروجر #حرق_ون_بيس
Tweet media one
1
0
3
@saudiYoda1
Abdulmajeed
6 months
الخطوة الرابعة: نتيجة العملية: بعد المعالجة، يمكن للنموذج أداء مهام مختلفة متعلقة باللغة مثل توليد النصوص، تصنيف المشاعر، وغيرها.
1
0
3
@saudiYoda1
Abdulmajeed
6 months
ثريد 🧵 الترتيب (Sort) شيء مهم جدًا في عالم البيانات وتحليلها. لما تقوم بعملية الترتيب بشكل صحيح في بياناتك، هذا بيحسن أداءها واسترجاعها ويجعل تحليلها أبسط. #GenerativeAI
1
1
3
@saudiYoda1
Abdulmajeed
6 years
النظره الاولى: منزل مسلسل "سترنجر ثينقز" في مدينه ألعاب يونيفرسال سيقام في ليله الهالوين! #StrangerThings3 #مسلسلات_اجنبية
0
1
3
@saudiYoda1
Abdulmajeed
6 years
سيمبسون يعلقون على #DC هومر: لما اشوف دي سي لوقو يجيني النوم! #Simpsons #مسلسلات_اجنبية
0
4
3