一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Mysql|Sql Server|Oracle|Redis|MongoDB|PostgreSQL|Sqlite|DB2|mariadb|Access|數據庫技術|

服務器之家 - 數據庫 - 數據庫技術 - 程序員應該知道的數據庫設計的兩個誤區

程序員應該知道的數據庫設計的兩個誤區

2021-10-15 16:02數據庫技術網 數據庫技術

在幾乎所有的企業級應用程序中,包括各種MIS、ERP、CRM等等,都會使用數據庫,這樣的好處是顯而易見的,很容易地實現了數據層和業務邏輯層的分離,而且對于性能的優化也在一定程度上提供了便利。

然而,在我所經歷過的項目中,某些數據庫的設計會存在一些問題,尤其普遍的就是下面將要描述的這兩點,個人覺得是應該避免的誤區,總結出來與大家討論。

誤區之一 備用字段

現象描述:

在數據表中,不僅設計了當前所需要的字段,而且還在其中留出幾個字段作為備用。

比方說,我設計了一個人員表(Person),其中已經添加了各種必要的字段,包括姓名(Name)、性別(Sex)、出生年月日(birthday)等等。大功告成之后,我忽然想到,將來系統中應該還會有很多其它與人相關的內容吧,比方說畢業院校,比方說工作單位等等,盡管現在根本不需要填寫,以后可能還是會用到的吧。拍腦袋一項,那就加入5個varchar2型的字段,分別叫做Text1、Text2……Text5,然后又想,應該還有一些日期型的字段需要備用,就又建立了三個date型的字段,分別起名叫做date1、date2、date3,……

原因分析:

大家應該已經看出問題了,在這個數據表中存在大量暫時無用的字段,我們可以稱之為備用字段,它們的作用是什么呢?就是以防萬一,防備可能的情況

這似乎可以叫做防患于未然,等到時候需要的時候,就不需要在表中增加新的字段了,而且這樣做的話,一個表的數據應該會被存儲在相鄰的物理空間中,這對于性能也是有好處的。

另外的原因就是,在古老的數據庫中,如果改變數據庫的定義(包括增加字段、改變字段的類型、刪除字段等等),那么其中所有的數據就會丟失,所以這項工作非常麻煩,我們需要先建立臨時表,將數據備份出來,然后創建新表,將數據導入其中,最后再刪除原來的表。

問題所在:

這樣的做法對于項目會導致很多問題,而且原先想要解決的問題并不一定能夠解決,不信的話,請往下看。

問題一:增加大量備用字段,必定會浪費很多空間,盡管其中可能都沒有具體的數據,但是僅僅是空字段也會占據一定的空間的。

問題二:由于命名的特點,如果沒有完善的文檔管理流程,用不了多久(可能也就是兩三年),就沒有人能夠說清楚到底哪個字段代表的是什么意義了。就算有文檔管理,這些管理工作也會比較麻煩,而且在每次使用的時候都需要申請,還有可能會出現沖突的情況。

問題三:增加了這些備用字段就真的會夠用嗎?不一定,因為我們只是每個類型的字段留出幾個備用,如果數量超過,或者要使用特殊的、不常用的類型的時候,還是需要增加新的字段。比方說在上述的Person表中,我們要存儲照片,那么可能就要增加一個blob類型的photo字段,這在初期設計的時候可不一定會留出這樣的備用字段。而且如果沒有完善的管理,誰又能說清楚倒底哪個字段已經被使用,哪個字段還可以使用呢?到時候還不是要增加新的字段。

解決方案:

其實上面的這種設計方式就是一種“過度設計”,我們應該做的就是“按需設計”,在經過詳細有效的分析之后,在數據表中只放置必要的字段,而不要留出大量的備用字段。

當需要增加相關的信息的時候,就要具體情況具體分析:

如果數量很少,而且信息的性質與原表密切相關,那么就可以直接在原表上增加字段,并將相關的數據更新進去。

如果數量較大,或者并非是原表對象至關重要的屬性,那么就可以新增一個表,然后通過鍵值連接起來。

對于表的數據的存儲位置所導致的性能問題,我們可以通過在特定時間對數據庫的數據進行重組來解決,而這項工作對于長期運行的數據庫來說,也是需要定期進行的。

誤區之二 有意義的編碼

現象描述:

使用有意義的編碼作為一條記錄的ID,甚至作為數據庫的主鍵存在,例如,一個員工的編碼設置為0203004,其中02代表員工所在分公司,03代表員工所在部門,004代表員工進入到該部門的序號。

原因分析:

ID的設置方式大概有以下幾種,一種是純粹的流水號,從1開始,每次加1,或者對其將以改進,將數字轉換成為字符串的格式,比方說“0000001”;一種是無意義的隨機編碼,比方說GUID;還有一種就是有意義的編碼,特定的位數會代表一定的意義。

我想之所以大家這么喜歡使用這種方式,主要是因為想要從編碼中就能夠得到一些信息,甚至有些程序中還有專門的對編碼進行解析的模塊。就像我們的身份證號碼一樣,看到身份證號就可以知道辦身份證時的所在地、生日、性別等信息。

問題所在:

其實有意義的編碼會導致很多問題,請看:

問題一:對編碼資源的浪費。如果是純粹的流水號,那么從1到10000就可以代表一萬條記錄,但是,如果使用有意義的編碼,很可能1000條記錄就會讓五位的編碼不夠用。我就遇到過真正的情況,我們公司的投保單號碼的第一位就是有意義的,代表的時該投保單所屬的渠道,后面跟著很長的一串數字(9位)。理論上來說,這些編碼永遠都不會用完,但是,最開始的三個渠道使用的是1、4、7三個編碼,但是一次新保險法的實行,導致原有的投保單作廢,于是又啟用了三個數字2、5、8,接下來公司改名,三個渠道又分別將投保單報廢,重新啟用新的開頭數字,就這樣,短短的幾年間,所有的投保單號碼全都被用完了,其實打印出來的投保單不過100萬張。

問題二:不一定是唯一的,難以作為主鍵。想一下,我們的身份證號碼就是這樣的。原先15位的時候,后三位是序號,而男性會使用奇數,女性會使用偶數,這樣就是說,一個地區同一天生日的人,男女都不能超過500人,否則就會導致號碼的重復,盡管出現這種現象的概率比較低,但是還是客觀存在的。

問題三:代表的意義不一定準確。比方說用帶有意義的編碼來為員工定義工號,其中可能會有部門、職務等等意義,但是如果員工在部門間發生了調動,或者職級發生了改變,是否需要改變他的編碼呢?改變吧,那么所有的歷史數據都要隨之修改一次,工作量會非常大;不改變吧,那么代表的意義就不再準確,我們就無法從編碼中得到該員工準確的信息。

解決方案:

所以,對于編碼,非常不建議使用有意義的編碼,要么使用純粹的流水號,但這樣可能需要定義一個范圍比較大的類型,對于海量記錄的數據,可能會不夠用;那樣的話就可以使用GUID,這樣編碼永遠都不會重復,而且會有大量的編碼資源可用。

從上面的兩點我們可以看出,在數據庫設計的過程中,有一些在非常多系統中都使用了,但是卻帶來了很多問題的方法,對于這種情況,我們就應該仔細思考,然后痛下決心,堅決抵制。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日韩不卡一区二区三区 | 成年人免费在线视频 | 亚洲成片在线看 | 俄罗斯freeoo性另类 | 日韩 视频在线播放 | 五月天91 | 日本高清va不卡视频在线观看 | 欧美亚洲另类综合 | 9久热这里只有精品视频在线观看 | 百合女女师生play黄肉黄 | 日韩福利一区 | 国产精品一级片 | 男生和女生搞逼逼 | 色悠久久久久综合网小说 | 日本 在线观看 | 精品久久成人免费第三区 | 国产毛片一级aaaaa片 | 久久国产精品永久免费网站 | 久久精品国产免费 | 成人在线观看一区 | 欧美帅老头oldmangay | 情侣奴伺候女王第2部分小说 | 亚洲欧美日韩另类在线 | 国产女主播在线播放一区二区 | 女教师被女同学调教成脚奴 | 国产精品欧美韩国日本久久 | 久久婷婷五月综合色丁香 | 22222色男人的天堂 | 色老板视频在线观看 | 国产激情一区二区三区成人91 | freexxx性欧美3d动漫 | 性xxx免费视频 | 青青国产精品 | 999热在线精品观看全部 | 门卫老张和女警花小说 | 免费xxxxx大片在线观看影视 | nhdta系列媚药系列 | 秋霞啪啪片 | 亚洲天堂网站在线 | 青草视频在线观看免费网站 | 亚洲精品第二页 |