ڊيٽا سائنس

ڊيٽا سائنس (Data Science) هڪ بين النظمياتي تعليمي ميدان آهي، [1] جيڪا امڪاني شور ۽ منظم يا غير منظم ڊيٽا کان علم کي ڪڍڻ يا وڌائڻ ۽ بصيرت پيدا ڪرڻ لاءِ، انگ اکر، سائنسي ڪمپيوٽنگ، سائنسي طريقن، پروسيسنگ، سائنسي تصور، الگورتھم ۽ سسٽم کي استعمال ڪري ٿو.[2]
ڊيٽا سائنس پڻ بنيادي ايپليڪيشن جي ڊومين (مثال طور، قدرتي سائنس، انفارميشن ٽيڪنالوجي ۽ طب) مان علم جي ڊومين کي ضم ڪري ٿو.[3] ڊيٽا سائنس گھڻ رخي آهي ۽ ان کي سائنس، هڪ تحقيقي نمونو، هڪ تحقيقي طريقو، هڪ نظم، هڪ ڪم جي فلو ۽ هڪ پيشي جي طور بيان ڪري سگهجي ٿو.[4]
ڊيٽا سائنس، ڊيٽا سان حقيقي رجحان کي سمجهڻ ۽ تجزيو ڪرڻ لاءِ انگن اکرن، ڊيٽا جي تجزيي، معلوماتيات ۽ انهن سان لاڳاپيل طريقن کي متحد ڪرڻ لاء هڪ تصور آهي.[5] اهو رياضي، شماريات، ڪمپيوٽر سائنس، اطلاعاتي سائنس ۽ ڊومين علم جي حوالي سان ڪيترن ئي شعبن مان تيار ڪيل ٽيڪنالاجي ۽ نظريا استعمال ڪري ٿو.[6] بهرحال، ڊيٽا سائنس ڪمپيوٽر سائنس ۽ انفارميشن سائنس کان مختلف آهي. ٽورنگ ايوارڊ کٽيندڙ جم گري ڊيٽا سائنس کي سائنس جي "چوٿين تمثيل" (تجرباتي، نظرياتي، ڪمپيوٽيشنل ۽ هاڻ ڊيٽا تي ٻڌل) تصور ڪيو ۽ زور ڀريو ته؛ "سائنس بابت سڀ ڪجهه انفارميشن ٽيڪنالاجي ۽ ڊيٽا جي ٻوڏ جي اثر سبب بدلجي رهيو آهي."[7][8]
ڊيٽا سائنسدان هڪ پروفيشنل آهي جيڪو پروگرامنگ ڪوڊ ٺاهي ٿو ۽ ان کي ڊيٽا مان بصيرت پيدا ڪرڻ لاءِ شمارياتي علم سان گڏ ڪري ٿو.[9]
بنياد
[سنواريو]
ڊيٽا سائنس هڪ بين الشعبائي علمي شعبو آهي[10] جيڪو عام طور تي علم حاصل ڪرڻ تي مرڪوز هوندو آهي، خاص ڪري وڏي ڊيٽا سيٽن مان، ۽ ان ڊيٽا مان حاصل ٿيل علم کي ٻين عملي شعبن ۾ مسئلا حل ڪرڻ لاءِ استعمال ڪندو آهي۔ هن شعبي ۾ ڊيٽا کي تجزيي لاءِ تيار ڪرڻ، ڊيٽا سائنس جا مسئلا ترتيب ڏيڻ، ڊيٽا جو تجزيو ڪرڻ، ۽ نتيجن کي خلاصو ڪرڻ شامل آهي۔ ان ڪري، هي شعبي ڪمپيوٽر سائنس، رياضيات، ڊيٽا ڏيکاءُ، گرافڪ ڊزائن، رابطي ۽ ڪاروبار مان مهارتون گڏ ڪري ٿو۔[11]
واسنت ڌر لکي ٿو ته شماريات (statistics) مقداري ڊيٽا ۽ بيان تي زور ڏئي ٿي۔ ان جي ابتڙ، ڊيٽا سائنس مقداري ۽ معياري ڊيٽا (جهڙوڪ تصويرون، متن، سينسرز، ٽرانزيڪشن، گراهڪن جي معلومات وغيره) ٻنهي سان واسطو رکي ٿي ۽ اڳڪٿي ۽ عمل تي زور ڏئي ٿي۔[12] اينڊرو گيلمين (اينڊرو گيلمين) جو ڪولمبيا يونيورسٽي (ڪولمبيا يونيورسٽي) مان چوڻ آهي ته انگ اکر ڊيٽا سائنس جو غير ضروري حصو آهن۔[13] اسٽينفورڊ يونيورسٽي جو پروفيسر ڊيوڊ ڊونوهو لکي ٿو ته ڊيٽا سائنس کي انگ اکر کان ڊيٽا سيٽن جي ماپ يا ڪمپيوٽنگ جي استعمال جي بنياد تي الڳ نٿو ڪري سگهجي، ۽ ڪيترائي گريجوئيٽ پروگرام گمراهه ڪندڙ طريقي سان پنهنجي اينالائيٽڪس ۽ انگ اکر جي تربيت کي ڊيٽا سائنس جو اصل جزو ظاهر ڪن ٿا۔ هو ڊيٽا سائنس کي هڪ عملي شعبي طور بيان ڪري ٿو جيڪو روايتي انگ اکر مان ترقي ڪري رهيو آهي۔[14]
نالي جي تشڪيل
[سنواريو]شروعاتي استعمال
[سنواريو]1962ع ۾، جان ٽوڪي هڪ شعبي جو بيان ڪيو جنهن کي هن "ڊيٽا تجزيو" سڏيو، جيڪو جديد ڊيٽا سائنس سان گهڻو مشابهت رکي ٿو۔[14] 1985ع ۾، بيجنگ ۾ چيني اڪيڊمي آف سائنسز ۾ ڏنل هڪ ليڪچر ۾ سي. ايف. جيف وو پهريون ڀيرو "ڊيٽا سائنس" جو اصطلاح استعمال ڪيو، جنهن کي هن انگ اکر (statistics) جو متبادل نالو قرار ڏنو۔[15] ان کان پوءِ، 1992ع ۾ مونٽپيلير يونيورسٽي II ۾ ٿيل هڪ انگ اکر جي سيمينار ۾ شرڪت ڪندڙن هڪ نئين شعبي جي اُڀرڻ کي تسليم ڪيو، جيڪو مختلف ذريعن ۽ شڪلين جي ڊيٽا تي مرڪوز هو ۽ جنهن ۾ انگ اکر ۽ ڊيٽا تجزيي جا قائم ٿيل اصول ڪمپيوٽنگ سان گڏيل هئا۔[16][17]
"ڊيٽا سائنس" جو اصطلاح 1974ع تائين به ڳنڍيو ويو آهي، جڏهن پيٽر ناور ان کي ڪمپيوٽر سائنس جي متبادل نالي طور پيش ڪيو۔ پنهنجي ڪتاب Concise Survey of Computer Methods ۾ هن تجويز ڏني ته "ڪمپيوٽر سائنس" بدران "ڊيٽا سائنس" استعمال ٿيڻ گهرجي ته جيئن ڊيٽا تي ٻڌل طريقن جي وڌندڙ اهميت ظاهر ٿئي۔[18][19] 1996ع ۾، انٽرنيشنل فيڊريشن آف ڪلاسيفڪيشن سوسائٽيز پهريون ڪانفرنس بڻجي جنهن ۾ خاص طور تي ڊيٽا سائنس کي موضوع طور شامل ڪيو ويو۔[19] تنهن هوندي به، ان وقت تائين تعريف اڃا مڪمل طور طئي نه ٿي هئي۔ 1997ع ۾، بيجنگ واري ليڪچر کان پوءِ، سي. ايف. جيف وو ٻيهر تجويز ڏني ته انگ اکرن کي "ڊيٽا سائنس" سڏيو وڃي، ڇاڪاڻتہ نئون نالو غلط خيالن (جهڙوڪ حساب ڪتاب تائين محدود هجڻ) کي ختم ڪرڻ ۾ مدد ڏيندو۔[20] 1998ع ۾، هاياشي چيڪيو ڊيٽا سائنس کي هڪ نئين، بين الشعبا تصور طور بيان ڪيو، جنهن جا ٽي پهلو هئا: ڊيٽا جو ڊزائن، گڏ ڪرڻ، ۽ تجزيو۔[17]
جديد استعمال
[سنواريو]2012ع ۾، ٽيڪنالاجي ماهرن ٿامس ايچ. ڊيونپورٽ ۽ ڊي. جي. پٽيل اعلان ڪيو ته "ڊيٽا سائنسدان: 21هين صديءَ جي سڀ کان پرڪشش نوڪري"،[21] جيڪو هڪ مشهور جملو بڻجي ويو ۽ وڏن اخبارن جهڙوڪ نيو يارڪ ٽائيمز [22] ۽ بوسٽن گلوب (بوسٽن گلوب)[23] ۾ به استعمال ٿيو۔ هڪ ڏهاڪي بعد، انهن ٻيهر تصديق ڪئي ته "هي نوڪري اڳي کان به وڌيڪ طلب ۾ آهي"۔[24] ڊيٽا سائنس جي جديد تصور کي هڪ آزاد شعبي طور ڪڏهن ڪڏهن وليئم ايس. ڪليولينڊ سان منسوب ڪيو ويندو آهي۔[25] 2014ع ۾، آمريڪن اسٽيٽسٽيڪل ايسوسيئيشن جي اسٽيٽسٽيڪل لرننگ اينڊ ڊيٽا مائننگ واري سيڪشن پنهنجو نالو تبديل ڪري اسٽيٽسٽيڪل لرننگ اينڊ ڊيٽا سائنس رکيو، جيڪو ڊيٽا سائنس جي وڌندڙ مقبوليت کي ظاهر ڪري ٿو۔[26] گذريل ڪجهه سالن ۾، ڪيترن ئي ڪاليجن ڊيٽا سائنس ۾ وڌيڪ منظم بيچلر پروگرام شروع ڪيا آهن۔ نيشنل اڪيڊميز جي رپورٽ موجب، مضبوط پروگرام عام طور تي انگ اکر، ڪمپيوٽنگ، اخلاقيات، ۽ رابطي جي تربيت شامل ڪن ٿا، گڏوگڏ ڪنهن مخصوص شعبي ۾ عملي ڪم به شامل هوندو آهي۔ جيئن اسڪول شاگردن کي ڊيٽا سان لاڳاپيل نوڪرين لاءِ تيار ڪرڻ جي ڪوشش ڪن ٿا، اهي طريقا وڌيڪ عام ٿيندا پيا وڃن۔[27]
"ڊيٽا سائنسدان" جو پيشاور عنوان 2008ع ۾ ڊي. جي. پٽيل ۽ جيف هيما رباشر سان منسوب ڪيو ويو آهي۔[28] جيتوڻيڪ اهو اصطلاح نيشنل سائنس بورڊ پاران 2005ع جي رپورٽ "Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century" ۾ استعمال ٿيو هو، پر ان جو مطلب عام طور تي ڪنهن به اهڙي اهم ڪردار لاءِ هو جيڪو ڊجيٽل ڊيٽا گڏ ڪرڻ جي انتظام سان لاڳاپيل هجي۔[29]
ڊيٽا سائنس ۽ ڊيٽا جو تجزيو
[سنواريو]
ڊيٽا سائنس ۾، ڊيٽا تجزيو اهو عمل آهي جنهن ۾ ڊيٽا جي جاچ، صفائي، تبديلي، ۽ ماڊلنگ ڪئي ويندي آهي ته جيئن مفيد معلومات حاصل ڪئي وڃي، نتيجا ڪڍيا وڃن، ۽ فيصلا سازي جي مدد ڪئي وڃي۔[30] هن ۾ ڳولاڳاڻي ڊيٽا تجزيو (EDA) شامل آهي، جيڪو گرافڪس ۽ وضاحتي انگن اکرن ذريعي نمونن کي ڳولي ٿو ۽ مفروضا (hypotheses) پيدا ڪري ٿو،[31] ۽ تصديقي ڊيٽا تجزيو، جيڪو شمارياتي استدلال استعمال ڪري مفروضن کي پرکي ٿو ۽ غير يقينيت کي ماپي ٿو۔[32]
عام سرگرمين ۾ شامل آهن:
- ڊيٽا گڏ ڪرڻ ۽ انضمام؛
- ڊيٽا صفائي ۽ تياري (گم ٿيل قدرن، غير معمولي قدرن، ڪوڊنگ، ۽ نارملائيزيشن جو سنڀال)؛
- خاصيتن جي انجنيئرنگ ۽ چونڊ؛
- ڏيکاءُ ۽ وضاحتي انگ اکر؛[31]
- شمارياتي يا مشين سکيا جا ماڊل ٺهڻ ۽ انهن جو جائزو؛[32]
- نتيجن جي پيشڪش ۽ ٻيهر پيدا ٿيڻ جي ضمانت (مثال طور رپورٽون، نوٽ بُڪ، ۽ ڊيش بورڊز)۔[33]
زندگي چڪر جا فريم ورڪ جهڙوڪ ڪرِسپ-ڊي ايم (CRISP-DM) انهن مرحلن کي بيان ڪن ٿا، ڪاروباري سمجهه کان وٺي نفاذ ۽ نگراني تائين۔[34] ڊيٽا سائنس ۾ عام طور تي وڏن ڊيٽا سيٽن سان ڪم ڪيو ويندو آهي، جيڪي تجزيي لاءِ جديد ڪمپيوٽنگ ۽ شمارياتي طريقن جي ضرورت رکندا آهن۔ ڊيٽا سائنسدان اڪثر ڪري غير منظم ڊيٽا (جهڙوڪ متن يا تصويرون) سان ڪم ڪندا آهن ۽ اڳڪٿي ڪندڙ ماڊل ٺاهڻ لاءِ مشين سکيا جا الگورٿم استعمال ڪندا آهن۔ ڊيٽا سائنس ۾ اڪثر شمارياتي تجزيو، ڊيٽا اڳ-پروسيسنگ، ۽ نگراني هيٺ سکيا استعمال ٿيندي آهي۔[35][36] تازين مطالعي مان ظاهر ٿيو آهي ته مصنوعي ذهانت هاڻي ڊيٽا-مرڪوز طريقن ڏانهن وڌي رهي آهي، جتي ڌيان صرف ماڊلز کي بهتر ڪرڻ بدران ڊيٽا سيٽن جي معيار تي ڏنو وڃي ٿو۔ هي رجحان نظام جي ڪارڪردگي کي بهتر بڻائڻ لاءِ ڊيٽا جي صفائي، سڌاري، ۽ ليبلنگ تي زور ڏئي ٿو (ڀٽ ۽ ٻين، 2024)۔ جيئن جيئن مصنوعي ذهانت جا نظام وڏا ٿين ٿا، ڊيٽا-مرڪوز نظرئي جي اهميت وڌندي پئي وڃي۔[37]
ڊيٽا سائنس هڪ تعليمي نظم جي طور تي
[سنواريو]جيئن اڳئين حصن ۾ بيان ڪيو ويو آهي، ڊيٽا سائنس، ڊيٽا جي تجزيي ۽ شماريات جي وچ ۾ ڪافي فرق آهي. نتيجي طور، جيئن انگ اکر لاڳو ٿيل رياضي مان هڪ آزاد ميدان ۾ وڌيا آهن، ساڳئي طرح ڊيٽا سائنس هڪ آزاد فيلڊ طور اڀري آهي ۽ تازو سالن ۾ ڪشش حاصل ڪئي آهي. ڪمپيوٽرائيزڊ ڊيٽا جي تجزياتي صلاحيتن تي پيشه ورانه مهارتن لاءِ منفرد گهربل مختلف آزاد ذريعن مان نڪرندڙ ڊيٽا جي وڌندڙ مقدار جي ڪري ڌماڪو ٿيو آهي. جڏهن ته انهن مان ڪجهه اعليٰ گهربل صلاحيتون شماريات دانن طرفان مهيا ڪري سگهجن ٿيون، اعليٰ الگورٿمڪ لکڻ جي مهارتن جي کوٽ انهن کي تربيت يافته ڊيٽا سائنسدانن کان گهٽ ترجيح ڏئي ٿي جيڪا مهارتن، جهڙوڪ اپاخي (Apache)، NoSQL، هادوپ (Hadoop)، ڪلائوڊ ڪمپيوٽنگ پليٽ فارمز ۽ پيچيده نيٽ ورڪن جي استعمال جي مهارتن سان منفرد ماهر مهيا ڪن ٿا. هن پيراڊم شفٽ ۾ مختلف ادارن جي ڪرافٽ اڪيڊمي پروگرامن کي مارڪيٽ لاءِ ماهر تيار ڪرڻ لاءِ ڏٺو آهي. ڪجهه ادارا جيڪا ڊيٽا سائنس ۾ ڊگري پروگرام پيش ڪن ٿا انهن ۾ اسٽينفورڊ يونيورسٽي، هارورڊ يونيورسٽي، يونيورسٽي آف آڪسفورڊ، اي ٽي ايڇ زيورخ ۽ ميرو يونيورسٽي شامل آهن.
ڊيٽا سائنس لاءِ ڪلائوڊ ڪمپيوٽنگ
[سنواريو]
ڪلاوڊ ڪمپيوٽنگ وڏي مقدار ۾ حسابي طاقت ۽ ڊيٽا اسٽوريج تائين رسائي مهيا ڪري سگهي ٿي۔[38] وڏي ڊيٽا جي حوالي سان، جتي معلومات جا وڏا مقدار لڳاتار پيدا ۽ پروسيس ڪيا وڃن ٿا، اهي پليٽفارم پيچيده ۽ وسيلا گهڻا استعمال ڪندڙ تجزياتي ڪم سنڀالڻ لاءِ استعمال ٿي سگهن ٿا۔[39] ڪجهه ورهايل ڪمپيوٽنگ فريم ورڪ وڏي ڊيٽا جي ڪم لاءِ خاص طور تي تيار ڪيا ويا آهن۔ اهي فريم ورڪ ڊيٽا سائنسدانن کي وڏي ڊيٽا سيٽن کي متوازي طريقي سان پروسيس ۽ تجزيو ڪرڻ جي قابل بڻائين ٿا، جنهن سان پروسيسنگ وقت گهٽجي سگهي ٿو۔[40]
ڊيٽا سائنس ۾ اخلاقي پھلو
[سنواريو]ڊيٽا سائنس ۾ ڊيٽا گڏ ڪرڻ، پروسيس ڪرڻ ۽ تجزيو ڪرڻ شامل هوندو آهي، جنهن ۾ گهڻو ڪري ذاتي ۽ حساس معلومات به شامل هوندي آهي۔ اخلاقي خدشن ۾ رازداري جي ڀڃڪڙي، تعصب جي واڌ، ۽ سماج تي منفي اثرات شامل آهن۔[41][42] ڊيٽا سائنس ۾ اخلاقي تعليم هاڻي صرف فني اصولن تائين محدود نه رهي آهي، پر وسيع فلسفياتي سوالن کي به شامل ڪري ٿي۔ تحقيق ڏيکاري ٿي ته ڊيٽا سائنس جي اخلاقي ڪورسن ۾ انساني مرڪز وارا موضوع، جهڙوڪ انصاف، ذميواري، ۽ ذميوار فيصلا سازي، وڌندڙ طور شامل ڪيا پيا وڃن، جنهن سان انهن کي اخلاقي ۽ سياسي فلسفي جي جاري بحثن سان ڳنڍيو وڃي ٿو (ڪولانڊو ۽ هارڊن، 2024)۔ هن طريقي جو مقصد شاگردن کي اهو سمجهائڻ آهي ته ڊيٽا تي ٻڌل ٽيڪنالاجيون سماج تي ڪيئن اثر انداز ٿين ٿيون۔[43] مشين لرننگ جا ماڊل تربيت واري ڊيٽا ۾ موجود اڳوڻن تعصبن کي وڌائي سگهن ٿا، جنهن سان امتيازي يا غير منصفاڻا نتيجا پيدا ٿي سگهن ٿا۔[44][45]
ڊيٽا سائنس جو هڪ ٻيو وڌندڙ ميدان ڊيٽا جي حوالن کي بهتر بڻائڻ آهي۔ ڊيٽا سيٽن جو حوالو ڏيڻ ٻين محققن لاءِ اهو سمجهڻ آسان بڻائي ٿو ته ڪهڙي ڊيٽا استعمال ڪئي وئي ۽ تحقيق کي ٻيهر ورجايو وڃي (لافيا وغيره، 2023)۔ اهي طريقا ڊيٽا گڏ ڪندڙ ۽ منظم ڪندڙ ماڻهن کي مناسب سڃاڻپ ۽ سھرا ڏين ٿا، جيڪو جديد تحقيق ۾ وڌيڪ اهميت حاصل ڪري رهيو آهي۔[46]
پڻ ڏسو
[سنواريو]| Wikibooks has a book on the topic of |
حوالا
[سنواريو]- ↑ Donoho, David (2017). "50 Years of Data Science". Journal of Computational and Graphical Statistics 26 (4): 745–766. doi:.
- ↑ Dhar, V. (2013). "Data science and prediction". Communications of the ACM 56 (12): 64–73. doi:. http://cacm.acm.org/magazines/2013/12/169933-data-science-and-prediction/fulltext. Retrieved 2 September 2015.
- ↑ Danyluk, A.; Leidig, P. (2021). Computing Competencies for Undergraduate Data Science Curricula (PDF). ACM Data Science Task Force Final Report (Report).
- ↑ Mike, Koby; Hazzan, Orit (2023-01-20). "What is Data Science?". Communications of the ACM 66 (2): 12–13. doi:. ISSN 0001-0782.
- ↑ Hayashi, Chikio (1998-01-01). "What is Data Science ? Fundamental Concepts and a Heuristic Example". ۾ Hayashi, Chikio; Yajima, Keiji; Bock, Hans-Hermann; Ohsumi, Noboru; Tanaka, Yutaka; Baba, Yasumasa (مرتب). Data Science, Classification, and Related Methods. Studies in Classification, Data Analysis, and Knowledge Organization (انگريزي ۾). Springer Japan. ص. 40–51. doi:10.1007/978-4-431-65950-1_3. ISBN 9784431702085.
- ↑ Cao, Longbing (2017-06-29). "Data Science: A Comprehensive Overview". ACM Computing Surveys 50 (3): 43:1–43:42. doi:. ISSN 0360-0300.
- ↑ Tony Hey; Stewart Tansley; Kristin Michele Tolle (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research. ISBN 978-0-9825442-0-4. محفوظ ڪيل مان اصل نسخي کان 20 March 2017 تي محفوظ ڪيل.
- ↑ Bell, G.; Hey, T.; Szalay, A. (2009). "Computer Science: Beyond the Data Deluge". Science 323 (5919): 1297–1298. doi:. ISSN 0036-8075. PMID 19265007.
- ↑ Davenport, Thomas H.; Patil, D. J. (October 2012). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review 90 (10): 70–76, 128. PMID 23074866. https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/. Retrieved 2016-01-18.
- ↑ Emmert-Streib, Frank; Dehmer, Matthias (2018). "Defining data science by a data-driven quantification of the community". Machine Learning and Knowledge Extraction 1: 235–251. doi:.
- ↑ "1. Introduction: What Is Data Science?". Doing Data Science (انگريزي ۾). O'Reilly. 2013. ISBN 978-1-4493-6387-1. 2020-04-03 تي حاصل ڪيل.
- ↑ Vasant Dhar (2013-12-01). "Data science and prediction" (en ۾). Communications of the ACM 56 (12): 64–73. doi:. http://archive.nyu.edu/handle/2451/31553.
- ↑ "Statistics is the least important part of data science « Statistical Modeling, Causal Inference, and Social Science". statmodeling.stat.columbia.edu. 2020-04-03 تي حاصل ڪيل.
- 1 2 Donoho, David (18 September 2015). "50 years of Data Science" (PDF). 2 April 2020 تي حاصل ڪيل.
- ↑ Wu, C. F. Jeff (1986). "Future directions of statistical research in China: a historical perspective". Application of Statistics and Management 1: 1–7. https://www2.isye.gatech.edu/~jeffwu/publications/fazhan.pdf. Retrieved 29 November 2020.
- ↑ Escoufier, Yves; Hayashi, Chikio; Fichet, Bernard, مرتب (1995). Data science and its applications. Tokyo: Academic Press/Harcourt Brace. ISBN 0-12-241770-4. OCLC 489990740.
- 1 2 Murtagh, Fionn; Devlin, Keith (2018). "The Development of Data Science: Implications for Education, Employment, Research, and the Data Revolution for Sustainable Development" (en ۾). Big Data and Cognitive Computing 2 (2): 14. doi:.
- ↑ "What is data science".
- 1 2 حوالي جي چڪ: Invalid
<ref>tag; no text was provided for refs named ":2". - ↑ Wu, C. F. Jeff. "Statistics=Data Science?" (PDF). 2 April 2020 تي حاصل ڪيل.
- ↑ Davenport, Thomas (2012-10-01). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review. 2022-10-10 تي حاصل ڪيل.
- ↑ Miller, Claire (2013-04-04). "Data Science: The Numbers of Our Lives". New York Times. New York City. 2022-10-10 تي حاصل ڪيل.
- ↑ Borchers, Callum (2015-11-11). "Behind the scenes of the 'sexiest job of the 21st century'". Boston Globe. Boston. 2022-10-10 تي حاصل ڪيل.
- ↑ Davenport, Thomas (2022-07-15). "Is Data Scientist Still the Sexiest Job of the 21st Century?". Harvard Business Review. 2022-10-10 تي حاصل ڪيل.
- ↑ Lua error in ماڊيول:WikidataIB at line 1825: attempt to index local 'args' (a nil value).
- ↑ Talley, Jill (1 June 2016). "ASA Expands Scope, Outreach to Foster Growth, Collaboration in Data Science". Amstat News. American Statistical Association.
- ↑ "Data Science for Undergraduates". www.nationalacademies.org (انگريزي ۾). 2025-11-23 تي حاصل ڪيل.
- ↑ Davenport, Thomas H.; Patil, D. J. (2012-10-01). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review. شمارو October 2012. ISSN 0017-8012. 2020-04-03 تي حاصل ڪيل.
- ↑ "US NSF – NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century". www.nsf.gov. 2020-04-03 تي حاصل ڪيل.
- ↑ Spiegelhalter, David (2019). The Art of Statistics: How to Learn from Data. Basic Books. ISBN 978-1-5416-1851-0.
- 1 2 Tukey, John W. (1977). Exploratory Data Analysis. Addison-Wesley. ISBN 978-0-201-07616-5.
- 1 2 James, Gareth; Witten, Daniela; Hastie, Trevor; Tibshirani, Robert (2017). An Introduction to Statistical Learning: with Applications in R. Springer. ISBN 978-1-4614-7137-0.
- ↑ O'Neil, Cathy; Schutt, Rachel (2013). Doing Data Science. O'Reilly Media. ISBN 978-1-4493-5865-5.
- ↑ CRISP-DM 1.0: Step-by-step data mining guide (Report) (انگريزي ۾). SPSS. 2000.
- ↑ Provost, Foster; Tom Fawcett (2013-08-01). "Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking". O'Reilly Media, Inc. (انگريزي ۾).
- ↑ Han, Kamber; Pei (2011). Data Mining: Concepts and Techniques (انگريزي ۾). ISBN 978-0-12-381479-1.
- ↑ Bhatt, Nikita; Bhatt, Nirav; Prajapati, Purvi; Sorathiya, Vishal; Alshathri, Samah; El-Shafai, Walid (2024-09-27). "A Data-Centric Approach to improve performance of deep learning models" (en ۾). Scientific Reports 14 (1): 22329. doi:. ISSN 2045-2322. PMID 39333381. Bibcode: 2024NatSR..1422329B.
- ↑ Hashem, Ibrahim Abaker Targio; Yaqoob, Ibrar; Anuar, Nor Badrul; Mokhtar, Salimah; Gani, Abdullah; Ullah Khan, Samee (2015). "The rise of "big data" on cloud computing: Review and open research issues" (en ۾). Information Systems 47: 98–115. doi:. https://linkinghub.elsevier.com/retrieve/pii/S0306437914001288.
- ↑ Qiu, Junfei; Wu, Qihui; Ding, Guoru; Xu, Yuhua; Feng, Shuo (2016). "A survey of machine learning for big data processing" (en ۾). EURASIP Journal on Advances in Signal Processing 2016 (1). doi:. ISSN 1687-6180. Bibcode: 2016EJASP2016...67Q.
- ↑ Armbrust, Michael; Xin, Reynold S.; Lian, Cheng; Huai, Yin; Liu, Davies; Bradley, Joseph K.; Meng, Xiangrui; Kaftan, Tomer; Franklin, Michael J.; Ghodsi, Ali; Zaharia, Matei (2015-05-27). "Spark SQL: Relational Data Processing in Spark". Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data (انگريزي ۾). ACM. ص. 1383–1394. doi:10.1145/2723372.2742797. ISBN 978-1-4503-2758-9.
- ↑ Floridi, Luciano; Taddeo, Mariarosaria (2016-12-28). "What is data ethics?" (en ۾). Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences 374 (2083). doi:. ISSN 1364-503X. PMID 28336805. Bibcode: 2016RSPTA.37460360F.
- ↑ Mittelstadt, Brent Daniel; Floridi, Luciano (2016). "The Ethics of Big Data: Current and Foreseeable Issues in Biomedical Contexts" (en ۾). Science and Engineering Ethics 22 (2): 303–341. doi:. ISSN 1353-3452. PMID 26002496. http://link.springer.com/10.1007/s11948-015-9652-2.
- ↑ Colando, Sara; Hardin, Johanna (2024-10-01). "Philosophy within Data Science Ethics Courses". Journal of Statistics and Data Science Education 32 (4): 361–373. doi:. https://doi.org/10.1080/26939169.2024.2394542.
- ↑ Barocas, Solon; Selbst, Andrew D (2016). "Big Data's Disparate Impact". California Law Review. doi:. https://lawcat.berkeley.edu/record/1127463.
- ↑ Caliskan, Aylin; Bryson, Joanna J.; Narayanan, Arvind (2017-04-14). "Semantics derived automatically from language corpora contain human-like biases" (en ۾). Science 356 (6334): 183–186. doi:. ISSN 0036-8075. PMID 28408601. Bibcode: 2017Sci...356..183C. https://www.science.org/doi/10.1126/science.aal4230.
- ↑ Lafia, Sara; Thomer, Andrea; Moss, Elizabeth; Bleckley, David; Hemphill, Libby (2023-04-28). "How and Why Do Researchers Reference Data? A Study of Rhetorical Features and Functions of Data References in Academic Articles" (en ۾). Data Science Journal 22 (1). doi:. ISSN 1683-1470.