|
前些天说到了mysql5提供了内置的xml文件解析和修改函数,今天找了点mysql网站上的资料和例子,翻译了一下,希望能给使用数据库存储xml和xslt的同志一些帮助。 mysql 5.1.5版本中添加了对xml文档进行查询和修改的函数,分别是extractvalue()和updatexml(),下面是这两个函数的使用示例: 还是一样我们首先建立一个示例数据库,然后将范例中使用的xml文档输入到数据库中: create table x (doc varchar(150)); insert into x values ('
a guide to the sql standard
cj date
'); insert into x values ('
sql:1999
j melton
'); 大家可以看到,doc列的内容中包含了自己的层次结构,以xml格式体现包含书名和作者的书本,其中作者还包含名字简写大写以及姓。这是流行的排版和储存格式,字母"" 和"是标记,使用户更容易理解内部的层次结构。 下面先看看extractvalue()的用法吧 语法: extractvalue (xml_document, xpath_string); 第一个参数:xml_document是string格式,为xml文档对象的名称,文中为doc 第二个参数:xpath_string (xpath格式的字符串) ,如果不了解xpath语法,可以在网上查找教程。 作用:从目标xml中返回包含所查询值的字符串 示例#e1: mysql> select extractvalue(doc,'/book/author/initial') from x; ------------------------------------------ | extractvalue(doc,'/book/author/initial') | ------------------------------------------ | cj | | j | ------------------------------------------ 2 rows in set (0.01 sec) 可以看到,extractvalue()函数将/book/author/initial节点中的值取出来,并通过select返回。因此需要简单的查找xml文档中的值,只要在xpath_string参数中指定好层次和节点就行了。 示例#e2 mysql> select extractvalue(doc,'/*/*/initial') from x; ---------------------------------- | extractvalue(doc,'/*/*/initial') | ---------------------------------- | cj | | j | ---------------------------------- 2 rows in set (0.01 sec) 如果查询前并不知道层次关系,你也可以使用通配符进行层次的匹配,不过当xml文档比较大的时候查找速度会很慢滴。 示例#e3 mysql> select extractvalue(doc,'/book/child::*') from x; --------------------------------------------- | extractvalue(doc,'/book/child::*') | --------------------------------------------- | a guide to the sql standard | | sql:1999 | --------------------------------------------- 2 rows in set (0.00 sec) 使用/book/child::语句我们可以找到book节点下的首个节点,文中是title。除了child以外,我们还有其他的参数: child ... 指定节点的下一子节点) descendant ... 节点下包含的所有层次中的数据 parent ... 指定节点的上一节点 ancestor ... 节点以上所有层次的数据 following-sibling ... 同一层次的下一个节点 preceding-sibling ... 同一层次的上一个节点 self ... 自身 示例#e4 mysql> select extractvalue(doc,'/book/author/surname[self:text()="date"]') from x; -------------------------------------------------------------- | extractvalue(doc,'/book/author/surname[self:text()="date"]') | -------------------------------------------------------------- | date | | | -------------------------------------------------------------- 2 rows in set (0.00 sec) 这里是一个使用条件表达式进行数据查找的例子,具体就不解释了,都是符合xpath语法的,大家可以参考一下xpath表达式的用法。 虽然上面的extractvalue()函数都使用在select列表中,其实该函数是可以使用在任何一个允许使用表达式的语句中的。 这里提示一点,使用这个函数可以轻松将xml文档列与全文检索结合起来。 来到updatexml()函数了 语法 updatexml (xml_document, xpath_string, new_value); 第一个参数:xml_document是string格式,为xml文档对象的名称,文中为doc 第二个参数:xpath_string (xpath格式的字符串) ,如果不了解xpath语法,可以在网上查找教程。 第三个参数:new_value,string格式,替换查找到的符合条件的数据 作用:改变文档中符合条件的节点的值 示例#u1 mysql> select updatexml(doc,'/book/author/initial','!!') from x; ---------------------------------------------------------- | updatexml(doc,'/book/author/initial','!!') | ---------------------------------------------------------- |
a guide to the sql standard
!! date
| |
sql:1999
!! melton
| ---------------------------------------------------------- 2 rows in set (0.00 sec) updatexml函数的前两个参数用法以及写法与extractvalue是一样的,因为这里需要查找到符合条件的数据节点。第三个参数就是为了替换节点字符串的。文中我们就使用!!字符串替换了book/author/initial节点的值。返回值是整个改变后的xml文档。这里记住,由于我们使用的是select语句,因此并没有对真正的数据进行修改,而是在内存中将取出的数据进行修改然后返回给用户。如果需要彻底的修改文档内容,可以使用下面语句: update x set doc = updatexml(doc,/book/author/initial','!!'); 细心的人也许发现这里有一个错误,也许是bug,因为我们并不想修改结构化的文档,而仅仅需要修改内容,但updatexml函数将cj>整个文本改成了!!,这样就不是我们所想要的了,因为它改变了整个文档结构。因此如果你需要的仅仅是修改这个结构化文档的内容部分,而不是整个文本,可以使用: updatexml(doc,'/book/author/initial','!!') from x; 示例#u2 mysql> select extractvalue( updatexml(doc,'/book/author/initial','!!'),'/book/author/ initial') from x; --------------------------------------------------------------------------- -------------------------- | extractvalue( updatexml(doc,'/book/author/initial','!!'),'/book/author/ initial') | --------------------------------------------------------------------------- -------------------------- | !! | | !! | --------------------------------------------------------------------------- -------------------------- 2 rows in set (0.01 sec) 最后一个例子,extractvalue()函数和updatexml()函数的嵌套使用,结果是给我们展示将initial节点的值改成!!后选择查询initial节点的内容,结果大家也能看到了。 上面只是这两个函数的最基本用法,如果大家还需要更多的资料,或有一些自己的心得,欢迎一起讨论。
|