转载

再讲IQueryable<T>,揭开表达式树的神秘面纱

最近园子里开发自己的orm那是一个风生水起,感觉不整个自己的orm都不要意思继续混博客园了。那么在此之前我们有必要仔细了解下 IQueryable<T> ,于是就有了此文。

什么是树?

这个问题好像有点白痴。树不就是树嘛。看图:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

我们从最下面的主干开始往上看,主枝-分支-分支....可以说是无限分支下去。我们倒过来看就是这样:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

平时我们用得最多的树结构数据就是XML了,节点下面可以无限添加子节点。我们想想平时还用过什么树结构数据,比如: 菜单无限分级 。

这和我们今天讲的有毛关系啊。错,我们今天主要就是来分析表达式树的。、

lambda表达式和表达式树的区别:

Lambda表达式:

Func<Student, bool> func = t => t.Name == "农码一生";

表达式树:

Expression<Func<Student, bool>> expression = t => t.Name == "农码一生"; 

咋一看,没啥区别啊。表达式只是用Expression包了一下而已。那你又错了,这是指Microsoft给我们展示的障眼法,我们看编译后的C#代码:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

第一个lambda表达式编译成了匿名函数,第二个表达式树编译成一了一堆我们不认识的东西,远比我们原来写的lambda赋值得多。

结论:

平时我们在 IQueryable<T> 中使用的表达式树,是我们编写的lambda表达式然后编译成的生成表达式树的特定方法,也就是说平时一般情况我们使用的表达式树都是编译器帮我们完成的。( 当然,我们可以可以手动的主动的去创表达式树。只是太麻烦,不是必要情况没有谁愿意去干这个苦活

我们来看看创建的表达式树到底和我们平时见到的树有什么不同:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

有没有看出点感觉来?Body里面有Right、Left,Right里面又有Right、Left,它们的类型都是继承自 Expression 。所以这种节点下面又有节点,可以无限附加下去的数据结构我们称为树接口数据。这也就成了我们的表达式树。

上面的 Student 实体类:


public class Student
{
    public string Name { get; set; }

    public int Age { get; set; }

    public string Address { get; set; }

    public string Sex { get; set; }
}

View Code

解析表达式树

上面我们看到了所谓的表达式树,其他也没有想象的那么复杂吗。不就是一个树结构数据嘛。如果我们要实现自己的orm,免不了要解析表达式树。一般说到解析树结构数据一般都会用到递归算法。

定义解析方法:

//表达式解析
public static class AnalysisExpression
{
    public static void VisitExpression(Expression expression)
    {
        switch (expression.NodeType)
        {
            case ExpressionType.Call://执行方法
                MethodCallExpression method = expression as MethodCallExpression;
                Console.WriteLine("方法名:" + method.Method.Name);
                for (int i = 0; i < method.Arguments.Count; i++)
                    VisitExpression(method.Arguments[i]);
                break;
            case ExpressionType.Lambda://lambda表达式
                LambdaExpression lambda = expression as LambdaExpression;
                VisitExpression(lambda.Body);
                break;
            case ExpressionType.Equal://相等比较
            case ExpressionType.AndAlso://and条件运算
                BinaryExpression binary = expression as BinaryExpression;
                Console.WriteLine("运算符:" + expression.NodeType.ToString());
                VisitExpression(binary.Left);
                VisitExpression(binary.Right);
                break;
            case ExpressionType.Constant://常量值
                ConstantExpression constant = expression as ConstantExpression;
                Console.WriteLine("常量值:" + constant.Value.ToString());
                break;
            case ExpressionType.MemberAccess:
                MemberExpression Member = expression as MemberExpression;
                Console.WriteLine("字段名称:{0},类型:{1}", Member.Member.Name, Member.Type.ToString());
                break;
            default:
                Console.Write("UnKnow");
                break;
        }
    }

}

调用解析方法:

Expression<Func<Student, bool>> expression = t => t.Name == "农码一生" && t.Sex == "男";
AnalysisExpression.VisitExpression(expression);

我们来看看执行过程:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

一层一层的往子节点递归,直到遍历完所有的节点。最后打印效果:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

基本上我们想要的元素和值都取到了,接着怎么组装就看你自己的心情了。是拼成sql,还是生成url,请随意!

实现自己的IQueryable<T>、IQueryProvider

仅仅解析了表达式树就可以捣鼓自己的orm了?不行,起码也要基于 IQueryable<T> 接口的编码风格吧。

接着我们自定义个类 MyQueryable<T> 继承接口  IQueryable<T>

 public class MyQueryable<T> : IQueryable<T>
 {
     public IEnumerator<T> GetEnumerator()
     {
         throw new NotImplementedException();
     }
     IEnumerator IEnumerable.GetEnumerator()
     {
         throw new NotImplementedException();
     }
     public Type ElementType
     {
         get { throw new NotImplementedException(); }
     }
     public Expression Expression
     {
         get { throw new NotImplementedException(); }
     }
     public IQueryProvider Provider
     {
         get { throw new NotImplementedException(); }
     }
 }

我们看到其中有个接口属性 IQueryProvider ,这个接口的作用大着呢,主要是作用是在执行查询操作符的时候重新创建  IQueryable<T> 并且最后遍历取值的时候执行sql远程连接。我们还看见了  Expression 属性。

现在我们明白了 IQueryable<T> 和  Expression (表达式树) 的关系了吧:

  •   IQueryable<T>  最主要的作用就是用来存储  Expression (表达式树)

下面我们也自定义个现实了 IQueryProvider 接口的类  MyQueryProvider

public class MyQueryProvider : IQueryProvider
{
    public IQueryable<TElement> CreateQuery<TElement>(Expression expression)
    {
        throw new NotImplementedException();
    }
    public IQueryable CreateQuery(Expression expression)
    {
        throw new NotImplementedException();
    }
    public TResult Execute<TResult>(Expression expression)
    {
        throw new NotImplementedException();
    }
    public object Execute(Expression expression)
    {
        throw new NotImplementedException();
    }
}

上面全是自动生成的伪代码,下面我们来填充具体的实现:


    public class MyQueryProvider : IQueryProvider
    {
        public IQueryable<TElement> CreateQuery<TElement>(Expression expression)
        {
            return new MyQueryable<TElement>(expression);
        }

        public IQueryable CreateQuery(Expression expression)
        {
            throw new NotImplementedException();
        }

        public TResult Execute<TResult>(Expression expression)
        {
            return default(TResult);
        }

        public object Execute(Expression expression)
        {
            return new List<object>();
        } 
    }  
    public class MyQueryable<T> : IQueryable<T>
    {
        public MyQueryable()
        {
            _provider = new MyQueryProvider();
            _expression = Expression.Constant(this);
        }

        public MyQueryable(Expression expression)
        {
            _provider = new MyQueryProvider();
            _expression = expression;
        }
        public Type ElementType
        {
            get { return typeof(T); }
        }

        private Expression _expression;
        public Expression Expression
        {
            get { return _expression; }
        }

        private IQueryProvider _provider;
        public IQueryProvider Provider
        {
            get { return _provider; }
        }

        public IEnumerator GetEnumerator()
        {
            return (Provider.Execute(Expression) as IEnumerable).GetEnumerator();
        }

        IEnumerator<T> IEnumerable<T>.GetEnumerator()
        {
            var result = _provider.Execute<List<T>>(_expression);
            if (result == null)
                yield break;
            foreach (var item in result)
            {
                yield return item;
            }
        }
    }

View Code

执行代码:

 var aa = new MyQueryable<Student>();
 var bb = aa.Where(t => t.Name == "农码一生");
 var cc = bb.Where(t => t.Sex == "男");
 var dd = cc.AsEnumerable();
 var ee = cc.ToList(); 

接着我们看看执行过程:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

结论:

  • 每次在执行  Where  查询操作符的时候  IQueryProvider  会为我们创建一个新的  IQueryable<T>  
  • 调用  AsEnumerable()  方法的时候并不会去实际取值 (只是得到一个IEnumerable)
  • 执行  ToList()  方法时才去真正调用迭代器  GetEnumerator()  取值
  • 真正取值的时候,会去执行  IQueryProvider  中的  Execute  方法。 (就是在调用这个方法的时候解析表达式数,然后执行取得结果)

我们看到真正应该办实事的 Execute 我们却让他返回默认值了。

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

现在估计有人反抗了,你到是具体实现下 Execute 。好吧! (其实通过上面说的解析表达式树,你可以自己在这里做想做的任何事了。)

首先为了简单起见,我们还是用一个集合做为数据源:

//构造Student数组
public static List<Student> StudentArrary = new List<Student>()
{
        new Student(){Name="农码一生", Age=26, Sex="男", Address="长沙"},
        new Student(){Name="小明", Age=23, Sex="男", Address="岳阳"},
        new Student(){Name="嗨-妹子", Age=25, Sex="女", Address="四川"}
};

然后,重新写一个VisitExpression2方法: (和之前的区别: 现在目的是取表达式树中的表达式,而不是重新组装成sql或别的)

public static void VisitExpression2(Expression expression, ref List<LambdaExpression> lambdaOut)
{
    if (lambdaOut == null)
        lambdaOut = new List<LambdaExpression>();
    switch (expression.NodeType)
    {
        case ExpressionType.Call://执行方法
            MethodCallExpression method = expression as MethodCallExpression;
            Console.WriteLine("方法名:" + method.Method.Name);
            for (int i = 0; i < method.Arguments.Count; i++)
                VisitExpression2(method.Arguments[i], ref  lambdaOut);
            break;
        case ExpressionType.Lambda://lambda表达式
            LambdaExpression lambda = expression as LambdaExpression;
            lambdaOut.Add(lambda);
            VisitExpression2(lambda.Body, ref  lambdaOut);
            break;
        case ExpressionType.Equal://相等比较
        case ExpressionType.AndAlso://and条件运算
            BinaryExpression binary = expression as BinaryExpression;
            Console.WriteLine("运算符:" + expression.NodeType.ToString());
            VisitExpression2(binary.Left, ref  lambdaOut);
            VisitExpression2(binary.Right, ref  lambdaOut);
            break;
        case ExpressionType.Constant://常量值
            ConstantExpression constant = expression as ConstantExpression;
            Console.WriteLine("常量值:" + constant.Value.ToString());
            break;
        case ExpressionType.MemberAccess:
            MemberExpression Member = expression as MemberExpression;
            Console.WriteLine("字段名称:{0},类型:{1}", Member.Member.Name, Member.Type.ToString());
            break;
        case ExpressionType.Quote:
            UnaryExpression Unary = expression as UnaryExpression;
            VisitExpression2(Unary.Operand, ref  lambdaOut);
            break;
        default:
            Console.Write("UnKnow");
            break;
    }
}

然后重新实现方法   Execute  

public TResult Execute<TResult>(Expression expression)
{
    List<LambdaExpression> lambda = null;
    AnalysisExpression.VisitExpression2(expression, ref lambda);//解析取得表达式数中的表达式
    IEnumerable<Student> enumerable = null;
    for (int i = 0; i < lambda.Count; i++)
    {
        //把LambdaExpression转成Expression<Func<Student, bool>>类型
        //通过方法Compile()转成委托方法
        Func<Student, bool> func = (lambda[i] as Expression<Func<Student, bool>>).Compile(); 
        if (enumerable == null)
            enumerable = Program.StudentArrary.Where(func);//取得IEnumerable
        else
            enumerable = enumerable.Where(func);
    }
    dynamic obj = enumerable.ToList();//(注意:这个方法的整个处理过程,你可以换成解析sql执行数据库查询,或者生成url然后请求获取数据。)
    return (TResult)obj;
}

执行过程:

再讲IQueryable&lt;T&gt;,揭开表达式树的神秘面纱

很多人只知道 IQueryable 的延迟加载,却不知道  IQueryable 的延迟加载是依赖于  IEnumerable ,下次说延迟加载不要忘记了  IEnumerable 的功劳哦!

小知识:

表达式树转成Lambda表达式:

Expression<Func<Student, bool>> expression = t => t.Name == "农码一生";
Func<Student, bool> func = expression.Compile();

总结:

表达式树的分析就告一段落了,其中还有很多细节或重要的没有分析到。下次有新的心得再来总结。

感觉表达式树就是先把表达式打散存在树结构里,然后可以根据不同的数据源或接口重新组装成自己想要的任何形式,这也让我们实现自己的orm成为了可能。

今天主要是对表达式树的解析、和实现自己的IQueryable<T>、IQueryProvider做了一个记录和总结,其中不定有错误的结论或说法,轻点拍!

文章首链: http://www.cnblogs.com/zhaopei/p/5792623.html

原文  http://www.haojima.net/zhaopei/579.html
正文到此结束
Loading...