題:
機器學習科學家的日常工作是什麼?
Jack Twain
2014-07-24 19:14:08 UTC
view on stackexchange narkive permalink

我是德國大學的CS專業碩士生,現在寫論文。如果要繼續攻讀博士學位或在行業中找到工作,我將在兩個月內做出非常艱難的決定。

我做博士學位的理由:

  • 我是一個非常好奇的人,我覺得我仍然缺乏太多知識。我想學很多東西,博士學位會為我提供幫助,因為我可以做更多的好課程並閱讀大量論文,並成為數據挖掘和機器學習方面的專家。我喜歡數學,但是在我的本科生(糟糕的大學)中並不擅長數學。現在在這個德國大學,我覺得我發展了很多很棒的數學技能,並且我想提高它,因為我真的很喜歡數學! (在本科生和一生中,我的數學真的很糟糕,但是現在我發現自己可以做得很好!)

  • 我將處理具有智力挑戰性的工作。

  • p>
  • 我必須誠實地說,我也討厭見到其他比我高學位的人。因此,如果我走進街上去見有博士學位的人,我不必說“哦,哇,這個傢伙比我聰明”。我寧願站在另一邊。 ;)

我不做博士學位的原因:

  • 我在互聯網上讀過關於做博士學位或不做博士學位的事情它。我發現在大多數情況下,擁有博士學位的人所做的工作與擁有碩士學位的人所做的工作相同。 (這是計算機科學的普遍觀察,而不是關於ML / DM)。

  • 我可以開始職業,並在1或2年內賺很多錢,然後我可能可以創辦我自己的公司。

尚不清楚的是什麼:

我仍然不知道最終的最終目標是什麼。有一家著名的小公司嗎?還是成為著名科學家?我仍然沒有這個問題的答案。

為了幫助我做出決定,我想知道兩件事:

  • 以擁有行業碩士學位的數據科學家/機器學習者的身份工作是什麼感覺?你做什麼樣的工作?尤其是當我以機器學習科學家的身份在亞馬遜上閱讀這些廣告時,我總是想知道它們的作用。

  • 與以前相同的問題,但有博士學位。您與大師做的事情不同還是相同?

  • 我要處理具有挑戰性的有趣問題嗎?還是有些無聊的東西?

作為一點說明:我見過一個在德國學習過機器學習博士學位的人,並且正在一家促進機器開發的公司工作學習軟件。據我了解,他的大部分工作是訓練人們使用方法和軟件(決策樹等)。

如果我能從某些方面獲得與德國/瑞士有關的經驗的答案,那將是很好的著名的好公司。

“……而且當每個人都是超級人時,沒人能做到”-《綜合症》中的超人症。 (http://www.youtube.com/watch?v=A8I9pYCl9AQ)聲名遠播。如果每個人都享有平等的份額,那麼就沒有足夠的需求。這是一個經濟難題,要求您要么變得與眾不同,變得與眾不同,成為天敵,要么失敗。 “因為我們都想成為大搖滾明星,並且住在開著15輛汽車的山頂房屋中。”媒體沒有答案-它也擠滿了掠食者,失敗了。小心運動。
這裡有一個相關的問題[在機器學習者中很難找到的技能](http://stats.stackexchange.com/q/104500/14640),在這裡也得到了許多相關的答案。
當您考慮行業時,附近可能還有一些人/公司可供您開發,其中之一是SAF(瑞士),現已被SAP收購。該站點上有研究數學家...也許他會自我介紹。 ;)如果沒有,請隨時在論壇外與我聯繫,我可以作介紹。 Booking.com(阿姆斯特丹)還在積極地僱用具有您,碩士或博士學位等背景的人員,以解決一些非常有趣的機器學習/數據挖掘問題。同樣,如有興趣,隨時聯繫。
我想您也可以在http://academia.stackexchange.com/上找到相關的問答。
不好意思地說,但是您列出來考慮博士學位(虛榮)的最後一個原因是很糟糕的。確保這不是您的主要驅動力,否則可能會把您撞到牆上。
在亞馬遜的工作-我認為大多數工作都去發布文檔或初級教授。您可以選擇的是在線廣告,在線商店(例如Zalando),我認為許多汽車公司現在正在進入物聯網(記錄其所有汽車發動機數據等),最後諮詢公司(進行上述/報告)。以上公司)。
我還要補充說,機器學習通常只是任何行業工作的一小部分。您必須對應用程序領域有透徹的了解(例如購物趨勢/從哪裡獲得相關數據/等等-特別是對於生物統計學,我想您需要擁有醫學學位)。您可能想看看他們組織比賽的Kaggle網站,然後嘗試參加比賽(並閱讀獲獎者的報告)。我認為您會發現大多數時候標準算法都可以勝出-但是要經過很多反複試驗/修改才能達到目標-而不是高級ML。
機器學習是一個有趣的領域,也是一個有益的領域。具有指定時間的博士學位會很好,但是不要僅出於展示他人的目的而選擇博士學位。
七 答案:
TonyMorland
2014-07-24 20:15:24 UTC
view on stackexchange narkive permalink

Alex,我無法對德國或瑞士進行特別評論,但我確實在一家跨國公司工作,該公司擁有來自不同國家的100,000多名員工。其中大多數人至少具有研究生學位,許多人具有碩士學位和博士學位,除了人事和行政人員外,我們大多數人都是一個或多個不同科學領域的專家。我有30多年的經驗,曾擔任過熟練的科學/技術專家,經理,項目經理,最終回到了我所喜歡的純粹的科學崗位。我也參與了招聘人員的工作,也許我的一些觀察結果對您來說很有價值。

  1. 大多數新畢業生確實並不確切知道他們想要什麼,通常需要幾年才能找出答案。在大多數情況下,由於多種原因,他們的工作經驗與他們的預期相差甚遠。有些工作場所令人興奮,而有些則枯燥乏味,“工作場所政治”,糟糕的老闆等等有時可能是個大問題。較高的學位可能不會或根本不會幫助解決這些問題。

  2. 大多數雇主都希望那些能夠“完成工作”並儘快提高工作效率的人。取決於雇主,更高的學位可能無關緊要。在某些情況下,除非您擁有博士學位,否則門是關閉的。在其他情況下,可能會關上門,因為您擁有博士學位,而雇主希望某人“缺乏理論知識,但有更多實踐經驗”。

  3. 博士學位不一定意味著更快晉升,甚至薪資差異很大,可能會或可能不會影響您所能獲得的職位。通常,當我面試求職者時,我對尋找具有相關工作經驗的人最感興趣。如果候選人的論文主題特別相關,那麼博士學位可能是確保職位的最終決定因素。

  4. 現在人們比以往更傾向於更換工作。在開始盤旋之前,您的年齡除以2 * pi在很多年內一直是不錯的經驗法則。有些人會工作一段時間,然後返回大學學習。有些人(像我一樣)從獲得博士學位開始,然後獲得“太好了而無法拒絕”的報價,然後離開博士學位去工作。我很抱歉這樣做嗎?不,一點也不,如果我要重新開始,無論如何我都會在完全不同的主題上做博士學位。

  5. 我能給你的最好建議是您最喜歡做的事情,看看它如何發展。沒有人能告訴你什麼對你最好。有時,您只需要嘗試一下,如果無法解決問題,則可以從中學習盡可能多的知識,然後繼續進行其他工作。正如羅丹所說:如果明智地使用體驗,任何事情都不會浪費時間。

  6. ol>
您的博士學位主題是什麼?您現在在哪個主題上攻讀博士學位?
亞歷克斯(Alex),這與您的問題完全無關,但我的原始博士學位與在油氣田勘探與開發中整合來自不同來源(地球物理,地質,岩石物理,生產與油藏工程數據)的各種信息的方法有關。那我現在該怎麼辦?機器學習與信息理論在金融市場中的應用。困難,挑戰和報酬更高! :-)無論您決定什麼,都可以玩!
我不確定我是否了解2 * pi規則。您能否舉例說明一下。
Marc Claesen
2014-07-25 16:41:33 UTC
view on stackexchange narkive permalink

在描述我對日常工作的看法之前,我將挑選一些我認為相關的文章(強調我的觀點):

  1. 我非常好奇
  2. 會與具有智力挑戰性的東西一起工作
  3. 我必須誠實地說,我也討厭看到其他人比我高(虛榮
  4. 我可以開始職業並在1或2年內賺很多錢
  5. 開始我自己的公司
  6. ol>

    基於1和2,您似乎對數據科學和研究總體上有著非常浪漫的看法。是的,您將開始研究有趣的問題,但肯定會是24/7(這適用於行業和研究)。

    基於2和3,您似乎考慮研究人類智力的巔峰之作,並將博士學位視為對您的智慧的認證。我不同意,因為:

  • 在學術研究和行業研究方面都存在智力上的挑戰。我認為這是一個奇怪的假設,認為學者會面臨最艱鉅的挑戰。
  • 擁有博士學位並不意味著您很聰明,而是意味著您有能力在自己的領域中進行出色的研究。研究並不是要比別人聰明(儘管有幫助)。創新和從不同角度解決問題也是非常重要的素質。如果您想證明自己比下一個人更聰明,請參加Mensa測試而不是博士學位。

以我個人的觀點,最聰明的人最終會隨著自己的選擇而過上幸福的生活,無論這意味著成為核物理學家還是木匠。不要根據他們是否授予您一些炫耀的東西來做出決定。 sub>

基於4和5,您似乎希望在某個時候成立自己的公司。請注意,在進行初創公司,甚至是面向技術的初創公司時,您可能不會將大部分時間花在實際技術上。營銷,業務計劃,管理等對成功的創業公司都同樣重要(甚至更多)。您希望博士如何提供幫助?


現在這些準備工作已不復存在:我對機器學習科學家的工作常規的個人看法。首先:您將在選擇大/複雜/有趣的數據集時使用最新技術。

...但是

真正的機器學習涉及很多艱鉅的工作

您我們將在一個充滿數學優雅的烏托邦世界中每工作一個小時,而由一隊計算機來競標。您的大部分時間都花在了艱苦的工作上:數據庫管理,準備數據集,規範化工作,處理不一致性等。我將大部分時間都花在了這些任務上。隨著時間的流逝,它們不會變得越來越令人興奮。如果您對主題不感興趣,那麼最終您將失去做這些事情的動力。

如果您上過機器學習課程,通常會得到帶有良好標籤的數據集,而不會出現不一致,丟失的數據的情況應該的。這不是現實生活中的機器學習。您將花費大部分時間來嘗試準備好運行自己喜歡的算法。

協作中的期望管理

如果您想進行跨學科項目,則必須學習如何與對您的工作一無所知的人一起工作(對於任何專業化)。在機器學習中,這通常意味著以下兩種情況之一:

  • 您的合作者看了太多電視,認為您可以通過精美的算法和許多出色的可視化解決所有問題。
  • 您的合作者不了解您使用的技術,因此不了解看不到好處或潛在的應用。
Zhubarb
2014-07-24 20:15:54 UTC
view on stackexchange narkive permalink

•以具有行業碩士學位的數據科學家/機器學習者的身份工作是什麼感覺?你做什麼樣的工作?尤其是當我以機器學習科學家的身份在亞馬遜上閱讀這些廣告時,我總是想知道它們的作用。

業務問題並沒有真正改變,具體取決於您的學位,因此您應該看看相同或相似的事物。如果您在大型組織中工作,則需要處理公司的大型數據集。通常可以是產品/客戶數據或運營數據(化學過程數據,金融市場數據,網站流量數據等)。一般的最終目標是利用數據為公司省錢或賺錢。

•與以前相同的問題,但有博士學位。您做的和大師做的不同還是相同的?

答案如上所述,您將做幾乎相同的事情。但是,在研究,定量分析或大型國際公司的類似技術部門中,如果您擁有博士學位,那麼您將擁有擁有理學碩士學位的人。就職業發展而言。博士會教您(或應該教您)成為一名獨立研究人員,因此,有了博士學位,公司通常會“珍視”您的勞動(好奇的技能和勤奮)。 但是,我強烈建議您不要博士學位,只是為了(可能)加快職業發展。博士學位很難,尤其是在最終痛苦的過程中,您必須喜歡(最好是愛)您的主題,我認為還有可能繼續留在學術界(這是揭示您對研究和partiuclar主題的親和力的代理人)的興趣,以便可以接受。

還請記住,回到擁有博士學位的行業後,您將落入職業階梯,最終可能會被引導到以技術為導向的支持角色(與那些為自己賺錢的人相比,他們的薪水更低)公司)-可能不是您的主要目標。最後,如果您在一家小型公司中工作,那麼在您自己的公司中,博士學位的優勢在職業發展或薪水方面幾乎消失了。

•我要處理具有挑戰性的有趣問題嗎?還是有些無聊的東西?

我想對此沒有通用的答案。 ML是跨學科的。如果您是分析師,則通常會查看數據並嘗試構建模型,如果您在開發方面,則最終要處理實現的難題。如果您是面向客戶的,則可能需要進行很多手握和培訓客戶的工作(但可能會賺更多的錢)。通常,對您問題的答案取決於個人喜好以及您的雇主提供多少靈活性。

我從來不想做博士學位以打動任何雇主。我只想要它主要是為了獲得知識
我認為這是正確的動機。
user3624251
2014-07-24 22:49:00 UTC
view on stackexchange narkive permalink

或者您可以嘗試加入一些研究人員小組,而統計學家和機器學習者並不是每天都出現的現象。例如侵擾和疾病傳播,植物學或生態學,社會昆蟲還是社會科學?

我不能給您確切的例子,但是如果您是一個只有幾個人的地方的優秀統計學家/ ML,那麼人們和不同的研究建議都將找不到您。關鍵是,您將不需要大量的工作就可以真正滿足需求。

如果您喜歡這個想法,那就嘗試在當前主題(行業)之外尋找機器學習問題吧,也許您將找到找到“挑戰性有趣問題”和“與具有智力挑戰性的東西一起工作”的方法。

Franck Dernoncourt
2014-07-24 23:11:43 UTC
view on stackexchange narkive permalink

我同意其他答案。我只想強調,對於像您這樣在猶豫不決而繼續攻讀博士學位或本科學位後從事該行業的人來說,一種常見的方式(至少在美國)是申請博士學位,然後請假(一年或更長時間)如果事情沒有他們預期的那麼好,或者只是想探索產業。通常,在本科之後就可以輕鬆地申請博士學位:您還沒有忘記進行考試的習慣,打算為您寫推薦信的教授仍然對您記憶深刻,等等。

此外,在博士學位和行業之間的比較中,您可能會希望比較有興趣的數據集的訪問權限,計算機集群的可用性,該地點的軟件工程技能以及每個項目分配的人數。

最後,您也可以在該行業中找到很多具有智力挑戰性的東西,例如查看IBM / Google / Microsoft / Nuance / Facebook / etc。研究部門(就像您可以在學術界找到很多在智力上沒有挑戰性的東西一樣)。例如。支持SVM的人們在AT&T工作,IBM Watson在IBM,Google Translate是最好的機器翻譯系統之一,Nuance和Google擁有最好的語音識別系統,與孤立的例子相距甚遠。實際上,我一直想知道行業和學術界中誰對機器學習研究的貢獻最大(關於Quora的數據庫研究,我曾問過同樣的問題:在過去十年中,數據庫研究是否主要由行業推動?)。

Facebook,Microsoft和Google(以及我猜想的許多其他大公司)聘用了許多訪問研究人員以及專職或兼職學者。我認為正是這些人(來自學術界)和這些公司幾乎無限的資源才是推動行業發展的主要動力。
bmargulies
2014-07-25 06:16:00 UTC
view on stackexchange narkive permalink

要獲得博士學位,您必須提高人類知識水平。您不僅需要學習更多的知識。您必須製作原創作品。這是一個漫長,緩慢而痛苦的過程,並非所有人都能成功。因此,只有在您認為自己對本領域有新的,創造性的貢獻時,才應該博士學位。

如果您只想學習該領域併申請該領域,最多只能選修碩士,然後在申請時花費餘生學習。讀東西。參加偶爾的工作坊。如果在某個時候您感染了做真正原創的衝動的慾望,請暫時中斷事業並嘗試獲得博士學位。

我也是這麼想的。但是,恐怕一旦進入這個行業,我就會遠離學術界而去思考它,而我可能會迷失在繁忙的行業世界中,因此我最終可能會忘記學術界,並失去現在的機會。
您是否認為@TonyMorland這樣的事情可以在*實踐中起作用?
我知道一些聰明又努力的博士。我知道博士學位隨著時間的流逝而衰敗。在所有或大多數情況下,“提高人類知識水平”的想法並不正確。如果增量步驟很小並且沒有有效擴散,那麼它實際上存在嗎?至於行業中發生的事情,到處都是相同的:您最常使用的功能會變得更強大,而每週低於幾個小時的閾值所使用的功能將會消失。行業將使您更好地在功能失調的組織中工作。不過,您可以獲得更多。
everydaypeople
2014-07-25 15:16:47 UTC
view on stackexchange narkive permalink

當您選擇/著名的小公司/路線時,您可以自由地在公司中建立研究部門。

在這裡,您可以像在不受限制的情況下那樣煩人地進行創新...探索所有您童年的幻想,具有智力挑戰性的事情...您設定的步伐...您將成為/ man/。

您不必坐在University Labs即可撰寫/ Killer /研究紙。

儘管如此,您仍可以隨時與Univ的相關研究部門進行協調。看到...? zweivögelmit eines stein:-)

...其他人的程度更高...

好吧,虛榮心要適度激勵我們尋求最好的。

祝你好運。

yb

這條路線聽起來很有趣,但這是理論。每個公司只有一個人可以建立研究部門。創意與生產或支付能力不同。您必須以任何一種方式寫出殺手級的論文。一種是捍衛部門預算或研究計劃,另一種是為研究計劃和部門預算提供資金。虛榮像驕傲一樣,是在秋天來臨之前出現的。作為人類,我們的自毀按鈕往往位於我們拍打自己背面的位置。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...